2026 年数据就绪指数:了解成功实现 AI 的基础

查看结果
| 技术

使用 Cloudera AI Workbench MCP 服务器集成 Agentic 工作流

Patrick Hunt headshot
Navita Sood Headshot
正在看电脑的女性
AI

自动化任务并提高数据从业人员效率

作为日常工作流程的一部分,数据科学家或 AI 工程师会执行不少琐碎的任务,例如上传数据集、针对不同的超参数运行和迭代相同的脚本、观察实验等。将这些任务交给 AI 智能体可以节省资源并增加可观的价值。

这就是Cloudera AI Workbench MCP 服务器的用武之地:它是一款开源模型上下文协议(MCP)服务器,旨在更好地与您的智能体工作流程集成。

什么是 Cloudera MCP 服务器以及它如何提供帮助

Cloudera 的 MCP 服务器充当安全翻译器。它使助手(如 Cloudera Agent Studio、Claude 或 Cursor)能够直接在 Cloudera AI Workbench 环境中执行任务。

这意味着您可以要求您的助手列出项目、上传文件和运行作业,服务器将使用平台的标准 API 执行这些操作。

图 1.Cloudera AI 工作台 MCP 服务器:架构

 

与现有治理集成

Cloudera MCP 服务器旨在与您现有的企业治理相配合,而不是绕过它。

  • 对于数据科学家和人工智能工程师:这有助于减少上下文切换,让您在启动平台任务时能保持在聊天或 IDE 中。助手负责协调,平台负责执行。

  • 对于平台和 MLOps 团队: 它将帮助触发评估脚本、上传新数据集,以及运行类似的测试。该集成还允许应用程序更新、删除、重启和跟踪实验。

安全设计

安全性是服务器设计的核心组成部分,旨在适应企业环境。

  • STDIO 运输: 默认情况下,它使用标准输入输出(STDIO)进行助手与服务器之间的通信。这就避免了为这种交互打开和管理一个新的网络端点。

  • 证书管理:服务器设计用于读取 Docker 密钥或环境变量中的凭证,避免硬编码密钥或通过命令行参数传递。

  • 便捷访问: 它使用您现有的 Cloudera AI Workbench API 密钥,允许您针对不同用户和用例适当地设置权限范围。

图 2. Cloudera Workbench MCP 服务器:安全设计

图 2. Cloudera Workbench MCP 服务器:安全设计

 

如何开始使用 Cloudera MCP Server

Cloudera MCP 服务器旨在帮助您的助手直接与您的平台进行交互,同时在您已建立的治理框架内运行。

入门过程很简单:

  1. 配置服务器:在 Docker 中运行开源服务器,提供您的 Cloudera AI Workbench 主机和 API 密钥作为机密信息
  2. 连接客户端:使用 STDIO 命令将您首选的 MCP 客户端(例如 Cloudera Agent Studio)指向服务器
  3. 提出您的第一个请求:您可以让助手“列出我的项目”来测试连接

示例工作流程

以下是一些您可以通过连接到 Cloudera MCP 服务器的助手执行的任务示例:

  • 列出我所有的活跃项目,并显示所有仍在运行的作业

  • 将 new-data-august.zip 文件上传到“fraud-detection”项目。

  • 使用 train-v3.py 脚本创建一个作业,分配 2 个 CPU 和 8GB 内存,然后运行它。

  • 将这些指标记录到名为“resnet-sweep”的实验中,并将运行标记为“new-data”

  • 获取最新的模型构建并将其部署到暂存端点

  • 重启“gradio-demo”应用程序

该服务器包括在整个项目生命周期中支持这些工作流程的工具,包括文件管理、作业执行、实验跟踪、模型部署和应用程序管理。

了解详情

如需详细的设置步骤、示例及完整功能列表,请访问 Cloudera MCP 服务器 GitHub 仓库。注意:GitHub 项目按原样提供,Cloudera 不提供正式支持。Cloudera MCP 服务器项目根据 Apache 2.0 许可证提供,Cloudera 对其使用不提供任何保证、支持或维护。

要了解有关 MCP 和 Cloudera 如何协同工作的更多信息,请查看我们的博客《利用 Cloudera MCP 服务器为 GenAI 带来上下文(Bringing Context to GenAI with Cloudera MCP Servers》。

准备好了吗?

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.