我们已经进入了采用人工智能的新阶段:88% 的企业人工智能项目在投产前就已停滞不前,不是因为想法不佳或模型薄弱,而是因为基础设施跟不上。云端 API 成本迅速提升。治理是事后才考虑的。延迟会增加。对于受监管的行业来说,将敏感数据迁移到公共端点根本不是一个选项。
弥合人工智能试运行与全面生产之间的差距需要将智能直接带到源头。Cloudera AI Inference Service 为企业团队提供了一个安全、性能高且具成本效益的生产模型服务层——直接运行在数据所在之处。
Cloudera 不再将数据作为模型上下文发送到云,而是将模型直接送到您面前——准确地在需要的地方解封智能,按设计保护智能,并自信地将其扩展到自己的防火墙后面。
大多数 AI 服务要求您将数据传输到云端,这在合规性、成本和延迟方面存在风险。Cloudera 采用将模型引入数据所在位置的方法。无论是在安全的虚拟私有云 (VPC) 中,还是在完全脱机和隔离的本地环境中,这种模型到数据的策略都能确保您的信息保持私密和受控,同时仍然能够实现高性能推理以驱动生产中的 AI。
在云中全天候运行 AI 会导致不断增加且难以预测的费用。这些按请求收费的费用会随着使用情况波动预算,使长期预测变得困难。通过将推理任务转移到组织已拥有和控制的基础设施上,团队可以规避这些外部使用费用。一旦人工智能进入稳态生产,成本变得更加可预测,随着工作负载扩展,投资回报率也会更高。
大多数云 AI 提供商引导客户进入其专有生态系统,这使得切换、扩展或完全控制模型变得困难。通过 Cloudera AI Inference Service,您可以部署多种AI能力,从NVIDIA的Nemotron等开源生成式AI大型语言模型到传统预测性模型,而无需放弃对知识产权的控制权或所有权。借助 NVIDIA AI 协议栈——NVIDIA Blackwell GPU、NVIDIA Dynamo-Triton 和 NVIDIA NIM 微服务 ,实现高性能、可扩展的模型服务——Cloudera AI Inference Service 让您在保持 AI 基础设施灵活、可移植和面向未来的同时,自由创新。
图 1:Cloudera AI Inference Service 架构
Cloudera AI Inference Service 正在云无法进入的领域开启新的 AI 应用场景:离线环境、主权基础设施以及延迟关键的运营。以下是 Cloudera AI Inference Service 目前支持的三个实际应用场景,早期用户已经开始实施。
在国防中,速度和安全是不可妥协的。但直到最近,情报人员仍花费数千小时手动筛选敏感的离线文件——这些文件因流程拖慢、量过大,且无法利用公共人工智能工具而不暴露风险。
现在,借助在隔离环境中运行的 Cloudera AI Inference Service,国防机构可以部署强大的 LLM 助手,在几秒钟内扫描和总结海量文档集合。这些模型完全离线运行:无需互联网,无需依赖云,不会发生数据泄露,帮助分析师更快地做出决策,同时又不损害安全性。
跨境金融以数十种语言存在。以前,翻译合同、欺诈报告或合规更新等文档意味着使用外部工具,这引发了对数据泄露和可审计性的严重担忧。
如今,全球顶级信用卡提供商之一正在探索 Cloudera AI Inference Service,并测试多语言模型的本地部署,以实时且完全内部控制的方式翻译 200 多个市场的敏感通信。通过在自己的基础设施上运行推理,他们提高了内部运营速度和客户响应速度,同时避免了第三方 API 带来的合规风险。
政府机构面临着更快地为更多人服务的压力,但员工往往依赖过时的门户网站和密集的政策手册。由于隐私要求和不可预测的成本,公共生成式 AI 工具不是一个选择。
Cloudera AI Inference Service 的早期实现支持使用内部机构文档训练的本地 AI 聊天机器人。这些代理帮助员工和选民快速自信地应对复杂话题,即时给出答案,同时完全掌控数据、提示和输出。
通过将模型带到您的数据所在位置,Cloudera AI Inference Service 正在帮助组织按照自己的条件扩展智能——具有可预测的成本和灵活性,可以从广泛的生产模型中进行选择。无论您是在应对隔离式安全要求,还是优化大规模全球运营,通往生产级 AI 的道路现已开放。
Cloudera AI 是构建、部署和治理各种类型 AI 的值得信赖的基础——从生成式 AI、代理式 AI 到传统机器学习——覆盖您的数据资产。
准备好扩展了吗?不要让基础设施限制人工智能策略。请访问 Cloudera AI Inference Service 网页了解用例演示,在本网络研讨会中了解更多信息,或预约演示,了解如何将“无处不在的 AI”变为现实。
This may have been caused by one of the following: