Cloudera 收购了 Octopai 的数据血缘和目录平台。阅读公告
概述
建立信任并掌控您的整个数据资产
Cloudera Octopai Data Lineage 是唯一一个专为即时自动处理最复杂的云、本地和混合数据环境而设计的 SaaS 解决方案。
自动收集所有数据源、ETL 流程、脚本和 BI 报告(无需手动标记),提供完整的最新数据血缘图。
赋能技术数据团队和业务用户,使他们能够在几秒钟内追溯任何问题到其根源,或评估即将发生的变更的影响。
为 IT 和业务用户提供交互式数据血缘图、审计跟踪和数据质量指标,为治理和监管审计提供依据。
快速收集元数据、脚本、代码和依赖项,无需任何手动操作——提高效率并降低整个数据堆栈的风险。
通过分析转换、依赖和关联来映射跨系统的数据流,所有操作均自动完成。
通过直观的搜索、丰富的元数据和上下文洞察,让用户能更快地查找并信任数据。
通过将可视化效果中不同来源的数据类型整合在一起,创建复杂的语义层,添加业务逻辑和过滤器,或合并来自其它可视化应用程序的数据。
支持本地部署、云端部署及混合系统——涵盖跨系统、系统内和细粒度的血缘。
用推断的关系填补空白,并通过上下文元数据增强数据血缘,实现无与伦比的可见性。
获得对所有数据流的前所未有的可见性
Cloudera Octopai Data Lineage 拥有超过 60 个原生集成,并通过我们的通用连接器支持非原生系统,为各种自动化数据血缘解决方案提供了最广泛的覆盖范围。
节省时间并在数据团队之间建立信任
50%
每周花费超过 5 小时进行数据流跟踪。
75%
等待长达数周的时间才能找到报告中的错误来源。
90%
在进行影响分析时,节省了大量的人工工作。
来源:Dataversity and Octopai Survey,2023年
面向技术用户
自动捕获并可视化跨数据库、ETL 作业和 BI 输出之间的依赖关系,提供端到端的数据流动视图,使工程师能够:
- 在几秒钟内追踪故障或瓶颈。
- 消除冗余流程和数据副本。
- 在所有管道中执行一致的质量规则。
- 加速交付新数据产品。
- 保留完整的审计记录以确保合规性。
面向企业用户
通过基于数据血缘的仪表盘,使公司能够更快、更明智地做出决策,使非技术背景的利益相关者能够:
- 通过提供透明度来信任数据。
- 减少“黑箱”问题的担忧。
- 将关键指标追溯到其基础数据源。
- 调查导致关键绩效指标变化的上游因素。
