在 The AI Forecast 第 65 集“Vibecoding 的责任:不受控制的 AI 如何扼杀云投资回报率”中,David Linthicum 与主持人 Paul Muller 一起揭示了混合云和多云环境的隐性成本,并解释了为什么云治理和弹性已成为董事会的优先事项。
随着备受瞩目的云服务中断事件暴露出隐藏的依赖关系和单点故障,IT 领导者必须重新思考混合云环境中的弹性、数据管理和责任。
以下是 Paul 和 David 对话中的一些亮点:
Paul:韧性是一个有趣的词,因为我认为人们经常将韧性与可靠性混为一谈,但两者之间确实有很大的区别,不是吗?
David:确实存在区别。我的意思是,韧性是指你能够避免这些灾难中断你的处理和业务。换句话说,A 计划、B 计划和 C 计划是什么?它的韧性和容错能力如何?可靠性本质上是指组件:它如何维护自身,以及如果出现故障,如何恢复。韧性是你的责任,可靠性不是。通常情况下,如果是与云提供商合作,责任在于他们,但你仍然会受到影响。你最终还是要为此买单。云服务提供商宕机时,你不会得到任何补偿。
Paul:韧性是一种架构产物,而不是某个组件的结果,对吗?它取决于你如何设计系统。这要追溯到企业架构。
David:一切都与架构有关,它存在于应用层和企业层。你必须构建并规划韧性。它不会自动实现,也不包含在云端。这就是人们感到惊讶的地方。他们原以为自己能够完全抵御任何问题,但现在他们意识到,自己也和其他人一样会犯错。构建人工智能系统、企业架构或任何类型的系统都存在一个问题。它的重要性不亚于安全、治理以及我们必须考虑的其他因素,甚至可能更重要。它必须能够实际运行,这样才能通过指标证明,即使发生最糟糕的情况,它也不会阻碍业务的正常运转。而你基本上需要投入资金和时间来解决这个问题。
如果您没有韧性,就无法从这类事情中恢复过来。
Paul:现在很多人都在谈论混合云,但在某些方面,它似乎是本地部署和云端环境优缺点的结合体。在最终会成为混合云的环境中,我们如何构建清晰的责任机制和可观测性?
David:如果你正在构建混合云和多云解决方案,你必须管理解决方案本身固有的复杂性,而韧性将是一个贯穿其中的通用控制平台。人们会想:“嗯,我要构建一个混合系统,这样我就可以故障转移到我的本地系统,甚至可以故障转移到另一个云平台。”这完全没问题,而且确实可行,但需要花钱。我认为,理解这些成本和资源是什么,以及如何管理它们,才是最大的争议点。
多云架构很棒,因为它允许你使用最好的技术来构建更高效的系统,但弹性和可靠性在这些架构中会成为问题。我常说,你可以拥有韧性,也可以拥有效率,但你不能两者兼得。我们要么必须构建具有韧性的架构,要么就得应对每年三四次的宕机,这将给企业造成数十亿美元的损失。
Paul:关于灾难性停机、成本超支和复杂责任等问题,许多公司考虑将工作负载回归也就不足为奇了。目前的情况如何?在尝试将部分工作负载带回本地时,人们遇到了哪些困难?
David:最大的问题是成本。这其中包含两个层面。首先,您已经在应用程序和云迁移上花费了大约五十万美元,现在却需要花费类似的金额才能将其迁移回来。其次,您必须向董事会解释这一决定以及未来的发展方向。这将是一场艰难的对话,因为这意味着要承认,最初预期更有价值、更可靠的云迁移并没有达到预期效果。届时,必须有人低声下气地解释,因此,公司需要迁移回一个能够更好地控制硬件的环境。
通常情况下,选择托管服务提供商和托管服务提供商会更加高效,但他们却被云成本压得喘不过气来。现在,他们开始关注人工智能工作负载,由于负担不起云成本,他们正试图加快迁移速度。尽管云对于人工智能来说是捷径,但它却是构建这些系统阻力最小的途径。你可以获得一个随时可用的完整生态系统,但这对于大多数企业来说成本太高。如果我们出于经济原因要回归传统模式,那么我们就必须投入一些资源来确保我们有效地做到这一点。
Paul:有多少企业里的开发者曾经在类似 Vibe Code 的应用程序中启动过一些小型项目,这些项目产生了惊人的计算或存储工作负载,最终导致成本超支?
David:你通过告诉 AI 系统你的理解以及它们需要编写的代码来进行编码。问题在于,它无法理解其中的细微差别。它不了解如何提高效率,最终导致你花费更多资金。所以,像 Vibe Code 这类东西,想想很有趣,但关键是我们必须对这些东西进行一些人为控制。我看到越来越多的编码系统推出,我的大多数客户都在尝试使用,但这些系统都失败了,因为它们无法达到所需的效率。
在 Spotify、Apple Podcasts 和 YouTube 上收听 The AI Forecast 节目,即可收听 David Linthicum 的完整对话。
This may have been caused by one of the following: