使用案例
- 云数据报表和仪表板
- 即时访问数据
- 数据仓库优化
- 操作和事件分析
- 研究与发现分析
数据仓库优化
通过现代数据仓库技术提高洞察力
全部或部分地将较难的工作负载从传统数据仓库迁移到Cloudera Data Warehouse 。部署以新型数据为基础的用例,并且以经济高效的方式容纳大量涌入的新用户。经过实战测试的开源引擎(如 Impala,HIVE LLAP 和 Hive on Tez) 以及Hue和可观测性等工具,可以大规模地对结构化和非结构化数据进行灵活、快速地分析。
操作和事件分析
分析海量事件和时间序列数据
传统数据仓库几乎不可能分析来自机器日志、传感器和其它边缘设备的海量事件和时序数据。Cloudera Data Warehouse基于Apache Kudu和Druid而构建,并与Cloudera DataFlow相结合,在性能、规模和易用性等方面实现了进一步的创新,可以解决当前面临的全新挑战:在具备自助服务分析能力的同时快速移动数据。
研究与发现分析
将大量的非结构化数据与关系数据相关联。
要实现高质量的预测,需要从大量的非结构化、半结构化、文本和关系数据中挖掘新的相关性、模式和洞察力。Cloudera Data Warehouse(与 Solr 一起用于全文搜索)和Cloudera AI(原名 Cloudera Machine Learning)从所有数据源中获取洞察,以实现更准确的预测。
Cloudera Data Warehouse 主要功能
在数分钟内即可启动并运行数据仓库,并开始分析通过直观的数据目录可轻松找到的数据集。 只需按一下按钮即可配置基于模板部署的数据仓库,并利用自动扩展和自动挂起功能通过零接触管理来管理它。
利用高性能SQL引擎(如 Impal 和 Hive LLAP)从大量数据中获得即时洞察力 — 150 PB的数据集已经在生产中得到了验证并且数据量仍在不断增长,同时实现了亚秒级的查询响应时间。通过工作负载隔离和优化来解锁数百个用户和数千个用例,确保所有人都可以基于相同的数据完成工作,而不会因插手别人职责范围内的事而造成冲突。
使用半结构和非结构化数据类型(例如机器日志、事件流、物联网传感器、媒体和情绪数据)增强传统数据集。使所有数据作为单一数据目录随时可用,可通过仪表板和报表以及特色和探索性分析进行访问。
利用大型语言模型和自然语言的强大功能,为您的查询和分析提供动力。这使得从代码审查、代码补全到代码解释等一切工作都变得可能。
通过Cloudera Data Visualization的AI Assistant,并利用大语言模型和自然语言,轻松快速创建交互式仪表板,第一时间共享来自整个业务的洞察。
通过端到端数据湖库使用AI提高数据生命周期效率
