Cloudera 最新研究: 企业 AI 和现代数据架构现状

阅读报告
概览

在单一平台中实现了数据湖的灵活性和数据仓库的高性能。

Open Data Lakehouse 可以帮助企业机构对大规模结构化和非结构化数据进行快速分析。Open Data Lakehouse 能够有效地打破数据孤岛,并允许数据团队在任何公有云和私有云上使用他们所选择的工具协作处理相同的数据。

这种现代数据架构为企业创造了两全其美的解决方案,既可以确保数据的可靠性,也能够带来数据管理的便利性。 针对同一数据运行 BI、AI、ML、流式分析,而无需迁移或锁定数据。

Cloudera Data Platform(CDP)提供了世界上唯一的开放式数据湖仓(open data lakehouse)云服务,并且具备以下优势:

开放架构

Cloudera 推出的数据湖仓云服务由 Apache Iceberg 提供技术支持,100% 开源,基于开放式标准,并且被社区广泛采用。它可以存储多种数据格式,并支持多种引擎能够处理同一数据。

易于采用

通过将 Iceberg 直接集成到共享数据体验(SDX)中,Cloudera 提供了部署数据湖仓的最便捷途径。并且,还具备众多其他功能,例如模式演化、隐藏分区以及更加简化的针对大型数据集的数据管理。

多个公有云

您可以在任何地方、任何公有云上或您自己的数据中心中构建一个数据湖仓。您只需构建一次,就可以在任何地方运行,而不会对您造成任何烦恼。Cloudera 针对所有云服务平台都提供了完全可移植的相同数据服务。

安全和治理

CDP 中的 Iceberg 表集成在 SDX 中,从而可以跨多个云实现统一安全、细粒度策略、治理、沿袭和元数据管理,因此您可以集中精力专注于分析您的数据,由我们为您分担一切后顾之忧。

Cloudera的开放式数据湖仓现已在私有云上推出使用。
关键组件
 

使用开放式数据湖仓为您的数据充电

多功能分析

Cloudera Data Platform 提供了全方位的数据服务,能够在您的数据湖仓上运行 AI、ML、BI、流式分析和数据工程。从数据撷取和流式传输到处理和持久化、编配、发现和访问,功能强大且可扩展的数据服务提供了关键的分析功能。当然,您也可以利用您自己选择的工具。

多功能分析

Cloudera Data Platform 提供了全方位的数据服务,能够在您的数据湖仓上运行 AI、ML、BI、流式分析和数据工程。从数据撷取和流式传输到处理和持久化、编配、发现和访问,功能强大且可扩展的数据服务提供了关键的分析功能。当然,您也可以利用您自己选择的工具。

 

 

开放式表格格式,Apache Iceberg

Apache Iceberg 是开放式数据湖仓的关键组成部分。这是一种用于大型数据分析场景的高性能开放式表格格式,Apache Iceberg 使用一种类似于 SQL 表的高可靠性表格式,能够使多个计算引擎同时工作。Apache Iceberg 提供了各种各样丰富的功能,例如时间行程、快照隔离、模式演化、隐藏分区等。

开放式表格格式,Apache Iceberg

Apache Iceberg 是开放式数据湖仓的关键组成部分。这是一种用于大型数据分析场景的高性能开放式表格格式,Apache Iceberg 使用一种类似于 SQL 表的高可靠性表格式,能够使多个计算引擎同时工作。Apache Iceberg 提供了各种各样丰富的功能,例如时间行程、快照隔离、模式演化、隐藏分区等。

 

 

共享数据体验(SDX)

SDX 是 CDP 的基本组成部分,它提供了一整套基于元数据的安全和治理技术。针对位于任何地方的所有基础架构,SDX 都具备跨数据和分析的综合性数据管理功能,从而极大地降低了风险和运营成本。IT 部门可以更快速地部署严格安全且受管控的数据湖仓,从而使更多用户可以访问更多数据,同时不影响其性能。

共享数据体验(SDX)

SDX 是 CDP 的基本组成部分,它提供了一整套基于元数据的安全和治理技术。针对位于任何地方的所有基础架构,SDX 都具备跨数据和分析的综合性数据管理功能,从而极大地降低了风险和运营成本。IT 部门可以更快速地部署严格安全且受管控的数据湖仓,从而使更多用户可以访问更多数据,同时不影响其性能。

 

 

强大的数据目录

通过利用 Cloudera data Catalog,在所有基础架构中的任何位置查找、管理和标记数据,并使生成相关洞见: 

  • 从单一位置搜索、查看和访问您的所有数据 

  • 了解、记录和监视数据及其使用

  • 以全面的洞察力尽责地协作和共享数据

强大的数据目录

通过利用 Cloudera data Catalog,在所有基础架构中的任何位置查找、管理和标记数据,并使生成相关洞见: 

  • 从单一位置搜索、查看和访问您的所有数据 

  • 了解、记录和监视数据及其使用

  • 以全面的洞察力尽责地协作和共享数据

 

 

 

 

Hello Fresh 标志

NEW YORKER:充分利用数据洞察力把握时尚潮流趋势并减少商品缺货。数据湖仓有助于这家全球性的零售品牌商NEW YORKER 预测客户对更好的店内体验的需求。

 

“Cloudera Data Platform 具备的极佳声誉、可靠性、可扩展性、快速性和出色的客户支持度是我们选择该产品的重要影响因素。”

—— Steffen Minz,NEW YORKER 数据科学主管

Hello Fresh 标志

NEW YORKER:充分利用数据洞察力把握时尚潮流趋势并减少商品缺货。数据湖仓有助于这家全球性的零售品牌商NEW YORKER 预测客户对更好的店内体验的需求。

 

“Cloudera Data Platform 具备的极佳声誉、可靠性、可扩展性、快速性和出色的客户支持度是我们选择该产品的重要影响因素。”

—— Steffen Minz,NEW YORKER 数据科学主管

Forrester报告缩略图

通过端到端数据湖仓使用AI提高数据生命周期效率

资源
 

获悉有关随时随地管理数据的更多洞见

Webinar

开放式数据湖仓如何为企业AI赋能

Whitepaper

数据架构相关文章:开放式数据湖仓

世界级的训练,技术支持和服务

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.