自主智能体无需每一步都进行人工指导,即可朝着复杂的目标采取行动。在企业环境中,部署这些智能体会带来一系列更为严峻的挑战:它们必须驾驭异构数据系统;满足合规性、审计和数据主权要求;并将所有数据保持在组织的运营范围内。
长程智能体代表一类新型自主人工智能,超越单一任务,能够通过数十个连续决策实现目标,运行数小时甚至数天的工作流程,同时始终保持上下文。在企业级规模下,这些挑战都会被放大。
Cloudera 与 NVIDIA 合作设计了 Cloudera Agent Studio(Cloudera AI Studios 的一部分),以精准应对这些挑战。
NVIDIA Nemotron 提供了模型基础:专为代理型人工智能和长程工作流程的高通量推理需求而打造。
Cloudera Agent Studio 在此基础上通过四个架构支柱提供了编排层:动态多步规划、透明的多智能体协作、确保准确性的上下文工程以及沙盒执行。每个支柱都解决了当自主智能体在企业级规模运作时出现的特定需求。
图 1:Cloudera Agent Studio 通过迭代多步规划、多智能体与工具和技能协作、工件驱动的上下文工程以及沙盒执行来协调自主工作流程——构建于 Cloudera AI Inference(由 NVIDIA NIM 提供支持)的模型服务基础之上,并采用 Nemotron 代理型人工智能。
企业 AI 始于数据治理。提示词、专有数据和模型输出必须在组织的运营边界内,满足合规要求且不涉及架构妥协。这就是私有 AI 的核心要求:完整的推理堆栈在企业内部运行,而不是在外部。
Cloudera AI 推理服务由 NVIDIA NIM 微服务驱动,能够在企业环境中直接实现高性能、可扩展的模型服务,将提示、数据和输出置于安全边界内。该服务由 NVIDIA AI 堆栈加速,包括 Blackwell GPU 和 Dynamo-Triton,支持多种模型,包括 NVIDIA 的 Nemotron 模型系列,用于具有高级推理、工具使用和长期工作流程的代理型人工智能。这一基础使组织能够在其数据上直接构建和运行企业级 AI 智能体——安全且可扩展。
企业数据环境并不整洁。真实的部署涉及数十个具有不一致模式、文档稀缺且从业务问题到正确数据源没有确定路径的数据库。智能体必须在运行时构建该路径。
Agent Studio 的协调器将探索视为执行的一部分。它将复杂请求分解为多步计划,迭代执行它们,并在每一步之后进行自我评估,然后再确定一条路径。这种自我修正的规划循环使智能体在从未遇到的环境中也能可靠运行,并在许多连续步骤中维持长期工作流程。
复杂的企业工作流程跨越多个领域,每个领域都需要不同的推理策略和专业工具。一个试图涵盖所有任务的单一智能体无法很好地针对任何一个任务进行优化,而且其范围越广,就越难以理解和管理智能体行为。
Agent Studio 是围绕专门的智能体构建的,每个智能体都针对特定领域并配备了相应的工具,由懂得如何授权的协调者进行协调。使这种协作透明且可重用的是智能体之间的沟通方式:每个智能体将结构化输出写入共享的项目上下文,后续智能体将这些输出作为明确且可查验的输入加以使用。完整的推理链在每一步都是可追溯的,提供了企业所需的审计能力和在多次运行中基于先前工作进行构建的可重用性。
在企业数据规模中,将原始数据直接传递给模型是行不通的。上下文窗口是有限的,随着非结构化上下文的增长,准确性在达到窗口限制之前就已经下降。
Agent Studio 将上下文窗口视为一种精密仪器:在每个步骤中,只有与该智能体的特定任务相关的信息才会到达模型。这种工件驱动的设计减少了 token 消耗,在提高准确性的同时降低了推理成本和延迟。这种结合使得长期工作流程在企业规模下变得易于操作。
自治智能体之所以真正强大,在于它们能够按工作流程的需要动态生成工具、技能及可执行代码;而这些能力,Agent Studio 均可原生支持。然而,若缺乏隔离机制,智能体生成的代码和工具直接在企业系统上执行将带来不可接受的风险。
我们设计 Agent Studio 的执行层时,默认采用隔离机制。所有代理生成的代码和工具执行都在沙箱运行时环境中运行,无法访问其定义范围之外的系统。代理从零权限开始,每个操作都在基础设施层由策略强制执行,而不是在代理进程内部执行。这为受监管行业提供了所需的可审计性,同时不限制代理可以执行的操作。
Cloudera 管理着超过 30 EB 字节的结构化数据,覆盖其客户基础,使得结构化数据分析在这种架构中产生了即时影响。一家大型传媒和娱乐公司部署了该解决方案,为业务用户和分析师提供了访问其运营数据的自然语言界面。他们的数据资产跨越数十个数据库,达到 PB 级规模,且通常存在元数据冲突和文档稀缺的问题。
Cloudera Agent Studio 协调由 NVIDIA Nemotron 支持的专用智能体,这些智能体在客户的私有网络内运行。一位业务用户的分析性问题触发了一个迭代规划循环:协调器自主探索数据资产,导航模式歧义,并识别正确的数据源。当分析需要超出SQL表达范围的统计计算时,编排器会委派给相应的代码执行智能体。中间产出被写入工件,并通过长期工作流程向前传递。所有生成的代码都在沙盒环境中执行,全程保持完整的审计跟踪。
曾经需要数据工程师、开发人员和分析师依次操作的工作流程,现在任何业务用户都能访问。智能体的输出,包括 SQL 命令、生成代码和可视化,均基于共享的项目上下文编写,每个输出都可检查和可审计。这些工件也可以导出为生产流程。由于智能体生成的代码是确定性的,即使底层模型不是确定性的,这些管道是可靠和可重复的,无需额外的工程。
这一架构中的每个支柱都建立在前一个支柱的基础之上。私有推理层提供了基础,支持长期工作流程所需的调用量和可靠性。迭代规划使智能体能够在从未见过的环境中航行。多智能体协作为多步推理带来领域级精度。基于工件的上下文管理提高了准确性,同时降低了推理成本和延迟。沙盒执行确保智能体在定义的边界内安全运行,每个操作均受监管且可审计。
Cloudera 和 NVIDIA 通过Cloudera Agent Studio 、由 NVIDIA NIM 提供支持的Cloudera AI Inference以及 NVIDIA Nemotron 系列模型,将这一架构变为现实。它们共同提供了在企业数据上直接运行企业 AI 智能体所需的构建编排和智能体推理基础——安全、私密且具有可扩展性。
要了解更多信息,请观看 Cloudera Agent Studio 的实际应用演示。
This may have been caused by one of the following: