2026 年数据就绪指数:了解成功实现 AI 的基础

查看结果
| 技术

统一数据访问是可信赖人工智能的基础

Navita Sood Headshot
通往建筑物和长椅的石板路
AI

多年来,IT 领导者一直面临着制定人工智能计划以实现企业目标的压力。但事实证明,从试验到生产的过程比任何人预想的都要艰难。

事后看来,这是因为这些早期实验的结构不够合理。人工智能模型被层层叠加在尚未准备好的数据资产之上。实验是孤立进行的,因此必须在整个企业内进行治理和安全改造,以扩大规模。与此同时,进行未经批准的人工智能实验的部门引入了影子人工智能,现在必须重新纳入政策、可审计性和控制之下。

实现人工智能目标意味着理清那些日益复杂、分散且物理分布复杂的数据资产。可扩展的前进道路是将人工智能引入数据,并重新思考人工智能如何访问数据。如果没有统一、规范的权限,直至最终环节,问责制和结果从根本上就是矛盾的。

为什么整合可能不是一个明智的策略

多年来,最清晰的答案(也是最常见的建议)是数据资产集中化:将所有内容移动到一个湖泊、仓库或云中,以创建一个真实的数据源。通过物理消除分布,减少数据孤岛,结束碎片化。

从理论上讲,这听起来很高效。但现实表明,至少在企业环境中,这是行不通的。

  • 数据量大使得大规模移动变得昂贵且缓慢
  • IT 和数据工程团队必须为访问提供便利,从而造成延迟并妨碍自助服务使用案例(如针对特定部门的人工智能代理和工具)
  • 监管界限限制了数据的存储地点和处理方式
  • 混合环境成为了永久性的固定设施,而非曾经被认为的过渡阶段
  • 集中化本身会带来延迟,影响实时分析和人工智能的使用案例

最终,整合迫使企业做出在人工智能时代无法承受的权衡取舍,因为实时响应和上下文对于实现价值至关重要。等待数据传输或在不同环境之间复制数据,都会削弱这两者。

更好的办法是数据联盟:使企业能够像统一数据一样运行,而无需强制移动数据。

数据联盟的真正含义

数据联盟往往会从技术层面来描述——例如查询引擎、连接器和分布式计算。对运营负责人而言,其影响更具战略意义。

简单来说,数据联盟实现了分布式系统间的统一数据访问,而无需物理上集中或复制数据。但结果才是关键。数据联盟使团队能够在数据已经存在的地方使用数据,使领导者能够对跨越云、内部部署和边缘系统的问题获得准确、最新的答案。

试想一家全球零售商在询问“我的 X 库存在哪里?”时,会收到一个能够同时反映仓库库存、实体店货架、在途货物以及电商履约中心库存的综合性答案。

或者想象当某个州政府机构询问“该申请人是否符合X项目的资格?”时收到一个统一的回复,其中包含税务记录、收入证明和现有福利登记信息——即使这些数据集仍然保存在不同的部门系统中。

数据联邦使这些结果成为可能,因为在该用户界面之下存在单一的治理策略——即统一的治理框架,规则绑定于数据本身,而非数据所在的存储系统。

实际上,这是一种逻辑数据统一,而非物理数据统一。这意味着授权查询可以端到端跨越数据资产,利用距离数据最近的计算资源,同时保持受控状态,确保每个访问点的一致性,并确保每个输出都可追溯和可审计。

正是这种基础使得人工智能具有可扩展性和可信度。

“一次治理,处处访问”的运营模式

如果说联邦是架构上的转变,那么“一次治理,处处访问”就是运营模式——它改变了企业对控制和规模的思考方式。

正如我们在本文前面简要提到的,采用联邦策略,治理策略跟随数据,而不是其物理存储位置。在实践中,这意味着安全规则始终如一地适用,无论发生什么情况。这使得可追溯性和可审计性成为基础性的内置功能,而非部署后才添加的附加功能。

除了审计机制之外,它还通过使顶层 AI 应用和代理能够在现有治理控制范围内实时访问更广泛的上下文,从而改进了它们。

对于运营领导者而言,其影响显而易见:

  • 更快的 AI 部署,加速自动化并提高效率
  • 减少跨地区和监管框架的合规瓶颈
  • 减少团队间的重复工作,降低基础设施和处理成本
  • 跨分布式运营的实时可见性,使每个人都能同时基于同一数据源开展工作
  • 增强高管对人工智能产出和决策的信心,加速信任和价值实现时间

这使团队能够专注于推动成果,而不是陷入跨环境协调和结果一致性审计的繁琐工作中。

为无处不在的人工智能时代做好准备

现代平台正在从以存储为中心的设计演变为面向混合永久性、监管审查和 AI 驱动的自动化而构建的智能数据访问层。

这种演变反映了更广泛的平台发展方向:将人工智能带到数据所在的任何位置,而不是强迫数据适应基础设施的限制。随着人工智能更深入地嵌入供应链、财务预测、欺诈检测和客户互动等领域,碎片化访问的成本只会越来越高。

行业分析师也得出了同样的结论。这一点在 Forrester 对数据架构提供商的评估中得到了体现,该评估将跨混合环境的统一、受控访问视为企业人工智能的核心架构能力。该排名将 Cloudera 评为 2025 年第四季度领导者。

统一、受控访问是可信人工智能的基础——而这一切都始于联邦。

但并非所有的联盟策略都是相同的。

在下一篇文章中,我们将探讨不同联邦模型的比较,以及企业在选择专为真正的混合数据访问、统一治理和大规模人工智能而构建的平台时应该考虑哪些因素。

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.