了解 Data-in-Motion Kubernetes 版本的详细信息观看网络研讨会
什么是流媒体?
Cloudera Streaming(原名 Cloudera Stream Processing)通过提供分析流数据复杂模式的能力并获得可指导实际工作的情报,助力客户将流转化为数据产品。
流式处理由 Apache Flink 和 Kafka 提供支持,并提供完整的企业级流管理和有状态处理解决方案。Kafka 作为存储流底层,Flink 作为核心流内处理引擎,以及对行业标准接口(如 SQL 和 REST )的鼎力支持,这三者的结合使开发人员、数据分析师和数据科学家能够轻松构建混合流数据管道,为实时数据产品、仪表盘、商业智能应用、微服务和数据科学笔记本提供支持。
欺诈检测、网络威胁分析、制造智能、商务优化、实时报价、即时贷款审批等用例现在都可以通过将数据处理组件向上游移动来满足这些实时需求。
由 Cloudera Streaming 驱动的混合流数据管道
Cloudera Streaming 用例
- 欺诈检测
- 客户分析
- 市场监测
- 日志分析
客户分析
实时客户分析可提高参与度、保留率和满意度
每一家企业机构都需要通过实时分析来提高客户参与度,但由于数据量过大而难以实施。Cloudera Streaming 通过在亚秒级延迟内处理海量数据,同时检测客户互动并实时推荐更好的产品,从而实现客户分析。
Cloudera Streaming 功能
-
由 Apache Flink 支持的流分析
-
由 Apache Kafka 支持的流消息传递
任意数据,任意地点,部署选项灵活
云端 Cloudera Streaming
Cloudera 拥有一整套集成的流处理功能,可部署在公有云中以实现高效扩展。
Cloudera Streaming 基于 Apache Kafka 和 Apache Flink 引擎而构建,并配备企业级工具以简化部署和管理。
Streams Messaging Manager 借助一系列功能扩展了Apache Kafka,可实现schema治理和监控、灾难恢复、智能再平衡以及强大的访问控制和调查。
SQL Stream Builder 通过强大的 SQL Console扩展了 Apache Flink,使 SQL 分析师可以查询流数据以及下游应用的协作和版本控制处理逻辑。
本地部署的 Cloudera Streaming
Cloudera 可本地部署,并通过流数据为实时管道和应用控制成本和缩小时延。Cloudera Streaming 基于 Apache Kafka 和 Apache Flink 引擎而构建,并配备企业级工具以简化部署和管理。
Cloudera Streaming - Kubernetes Operators
Cloudera Streaming 功能也可作为 Kubernetes Operator 使用,可通过现有的 Kubernetes 集群独立部署,更轻松地实现 Kafka 在企业中的部署和扩展。Kubernetes operator 中部署了Kafka, Cruise Control 和 Zookeeper,通过强大的信息代理服务在 Kubernetes 上实现流用例,并借助 Flink 和 SQL Stream Builder 提供现代分布式流处理引擎来构建在容器上本地运行的实时流应用。
Cloudera Streaming Community Edition
Cloudera Streaming Community Edition 使开发流处理器变得容易,可以在您的桌面或任何其他开发节点上完成。
分析师、数据科学家和开发人员现在可以评估新特性,在本地开发基于 SQL 的流处理器,以及开发 Kafka 消费者/生产者和 Kafka 连接器,都可在本地完成,然后再进入生产。
使用 Streaming Community Edition,只需 5 分钟即可开始运行。
