概览
以任意规模安全可靠地简化和操作数据管道。
CDP Data Engineering 是专为企业数据工程团队量身定制的云原生服务。Data Engineering 是基于 Apache Spark 构建的全包的数据工程工具集,可通过 Apache Airflow、高级管道监控、可视化故障排除和综合型管理工具实现业务流程自动化,以简化整个企业分析团队的 ETL 流程。
Data Engineering 与 Cloudera Data Platform 完全集成在一起,可通过 SDX 实现端到端的可见性和安全性,同时也可与CDP服务(如CDP Data Warehouse和Machine Learning)无缝集成。基于 CDP 的 Data Engineering 可在任何地方的混合云平台上提供一致、可重复和自动化的数据工程工作流。
CDP Data Engineering使用案例
可在任何地方自动化数据管道
获得 ETL 可见性和控制权
始终保持数据完整性
可在任何地方自动化数据管道
将高质量的数据集安全地交付到 CDP Data Warehouse、CDP Machine Learning 或任何其它分析工具。
Data Engineering 简化了通往分析团队的数据管道,包括从机器学习到数据仓库等等。通过编排和自动化数据管道来加速价值实现时间,并且以安全、透明的方式在任何地方提供精选的高质量数据集。
获得 ETL 可见性和控制权
透明地全面管理数据生命周期。
当您希望大规模地运转整个企业的数据管道时,妥善地管理数据生命周期和控制好成本变得越来越复杂。
Data Engineering 提供了一整套操作控制和可见性功能,可用于跨业务用例进行容量规划、管道自动化、自动沿袭捕获以及故障排除。
始终保持数据完整性
提供完整的数据管道可见性以保护您的业务。
随着数据量和复杂性的不断增长,在确保持续的准确性和保真度的前提下扩展整个企业的分析工作负载是十分困难的。
Data Engineering 可提供本地数据管道监视和警报功能以及早发现问题,并提供可视化故障排除功能以在问题影响业务之前快速解决问题。