多年来,IT 领导者一直面临着制定人工智能计划以实现企业目标的压力。但事实证明,从试验到生产的过程比任何人预想的都要艰难。
事后看来,这是因为这些早期实验的结构不够合理。人工智能模型被层层叠加在尚未准备好的数据资产之上。实验是孤立进行的,因此必须在整个企业内进行治理和安全改造,以扩大规模。与此同时,进行未经批准的人工智能实验的部门引入了影子人工智能,现在必须重新纳入政策、可审计性和控制之下。
实现人工智能目标意味着理清那些日益复杂、分散且物理分布复杂的数据资产。可扩展的前进道路是将人工智能引入数据,并重新思考人工智能如何访问数据。如果没有统一、规范的权限,直至最终环节,问责制和结果从根本上就是矛盾的。
多年来,最清晰的答案(也是最常见的建议)是数据资产集中化:将所有内容移动到一个湖泊、仓库或云中,以创建一个真实的数据源。通过物理消除分布,减少数据孤岛,结束碎片化。
从理论上讲,这听起来很高效。但现实表明,至少在企业环境中,这是行不通的。
最终,整合迫使企业做出在人工智能时代无法承受的权衡取舍,因为实时响应和上下文对于实现价值至关重要。等待数据传输或在不同环境之间复制数据,都会削弱这两者。
更好的办法是数据联盟:使企业能够像统一数据一样运行,而无需强制移动数据。
数据联盟往往会从技术层面来描述——例如查询引擎、连接器和分布式计算。对运营负责人而言,其影响更具战略意义。
简单来说,数据联盟实现了分布式系统间的统一数据访问,而无需物理上集中或复制数据。但结果才是关键。数据联盟使团队能够在数据已经存在的地方使用数据,使领导者能够对跨越云、内部部署和边缘系统的问题获得准确、最新的答案。
试想一家全球零售商在询问“我的 X 库存在哪里?”时,会收到一个能够同时反映仓库库存、实体店货架、在途货物以及电商履约中心库存的综合性答案。
或者想象当某个州政府机构询问“该申请人是否符合X项目的资格?”时收到一个统一的回复,其中包含税务记录、收入证明和现有福利登记信息——即使这些数据集仍然保存在不同的部门系统中。
数据联邦使这些结果成为可能,因为在该用户界面之下存在单一的治理策略——即统一的治理框架,规则绑定于数据本身,而非数据所在的存储系统。
实际上,这是一种逻辑数据统一,而非物理数据统一。这意味着授权查询可以端到端跨越数据资产,利用距离数据最近的计算资源,同时保持受控状态,确保每个访问点的一致性,并确保每个输出都可追溯和可审计。
正是这种基础使得人工智能具有可扩展性和可信度。
如果说联邦是架构上的转变,那么“一次治理,处处访问”就是运营模式——它改变了企业对控制和规模的思考方式。
正如我们在本文前面简要提到的,采用联邦策略,治理策略跟随数据,而不是其物理存储位置。在实践中,这意味着安全规则始终如一地适用,无论发生什么情况。这使得可追溯性和可审计性成为基础性的内置功能,而非部署后才添加的附加功能。
除了审计机制之外,它还通过使顶层 AI 应用和代理能够在现有治理控制范围内实时访问更广泛的上下文,从而改进了它们。
对于运营领导者而言,其影响显而易见:
这使团队能够专注于推动成果,而不是陷入跨环境协调和结果一致性审计的繁琐工作中。
现代平台正在从以存储为中心的设计演变为面向混合永久性、监管审查和 AI 驱动的自动化而构建的智能数据访问层。
这种演变反映了更广泛的平台发展方向:将人工智能带到数据所在的任何位置,而不是强迫数据适应基础设施的限制。随着人工智能更深入地嵌入供应链、财务预测、欺诈检测和客户互动等领域,碎片化访问的成本只会越来越高。
行业分析师也得出了同样的结论。这一点在 Forrester 对数据架构提供商的评估中得到了体现,该评估将跨混合环境的统一、受控访问视为企业人工智能的核心架构能力。该排名将 Cloudera 评为 2025 年第四季度领导者。
统一、受控访问是可信人工智能的基础——而这一切都始于联邦。
但并非所有的联盟策略都是相同的。
在下一篇文章中,我们将探讨不同联邦模型的比较,以及企业在选择专为真正的混合数据访问、统一治理和大规模人工智能而构建的平台时应该考虑哪些因素。
This may have been caused by one of the following: