适用于 Amazon Bedrock AgentCore 的 Spring AI SDK 现已正式可用

Agentic AI 正在改变企业使用生成式 AI 的方式，从提示-响应式交互迈向能够规划、执行并完成复杂多步骤任务的自主系统。尽管 Agentic AI 领域的早期概念验证已经引起业务相关方的兴趣，但要将其扩展到生产环境，仍需解决可扩展性、治理和安全方面的挑战。Amazon Bedrock AgentCore 是一个 Agentic AI 平台，可使用任意框架和任意模型来大规模构建、部署和运行智能体。

Java 开发者希望使用熟悉的 Spring 模式来构建 AI 智能体，但面向生产环境的部署需要从零实现复杂的基础设施。Amazon Bedrock AgentCore 提供了一系列构建模块，例如托管运行时基础设施（可扩展性、可靠性、安全性、可观测性）、短期和长期记忆、浏览器自动化、沙盒代码执行以及评估能力。当前，要将这些能力集成到 Spring 应用中，通常需要编写自定义控制器以满足 AgentCore Runtime 契约、处理服务器发送事件（SSE）流、实现健康检查、管理速率限制，并接入 Spring advisors、记忆仓库和工具定义。在真正开始编写 AI 智能体逻辑之前，这往往意味着数周的基础设施工作。

借助新的 Spring AI AgentCore SDK，你可以构建可用于生产环境的 AI 智能体，并在具备高扩展性的 AgentCore Runtime 上运行。Spring AI AgentCore SDK 是一个开源库，它通过开发者熟悉的模式将 Amazon Bedrock AgentCore 的能力引入 Spring AI，这些模式包括注解、自动配置和可组合的 advisors。对于使用 Spring AI 的开发者来说，只需添加依赖、为方法添加注解，其余工作由 SDK 处理。

理解 AgentCore Runtime 契约

AgentCore Runtime 以按使用付费的方式管理智能体生命周期和扩缩容，这意味着你无需为空闲计算资源付费。运行时会将传入请求路由到你的智能体，并监控其健康状态，但这要求你的智能体遵循一套契约。该契约要求实现暴露两个端点。`/invocations` 端点接收请求，并以 JSON 或 SSE 流的形式返回响应。`/ping` 健康检查端点则报告 Healthy 或 HealthyBusy 状态。长时间运行的任务必须表明自己处于忙碌状态，否则运行时可能会为了节省成本而将其实例缩减。SDK 会自动实现这套契约，包括异步任务检测，从而在智能体处理任务时报告忙碌状态。

除了这套契约之外，该 SDK 还为生产工作负载提供了额外能力，例如以正确的帧格式处理 SSE 响应、处理背压，以及为大型响应管理连接生命周期。它还提供速率限制能力，通过限制请求速率来保护你的智能体免受流量突增影响，并控制每位用户的使用量。你可以将重点放在智能体逻辑上，而 SDK 则负责处理与运行时的集成。

在这篇文章中，我们将构建一个可用于生产环境的 AI 智能体：从一个聊天端点开始，然后逐步加入流式响应、会话记忆，以及用于网页浏览和代码执行的工具。到最后，你将获得一个功能完整的智能体，可部署到 AgentCore Runtime，或在你现有的基础设施中独立运行。

解决方案概览

Spring AI AgentCore SDK 基于三项设计原则构建：

下图展示了 SDK 各组件之间的交互方式。`@AgentCoreInvocation` 注解负责处理运行时契约，而 `ChatClient` 则组合了 Memory advisors、Browser tools 和 Code Interpreter。部署到 AgentCore Runtime 是可选的。你也可以将这些 SDK 模块作为独立功能来使用。

创建你的第一个 AI 智能体

下面的部分将逐步介绍如何创建一个功能完整的智能体：

步骤 1：添加 SDK 依赖

将 Spring AI AgentCore BOM 添加到你的 Maven 项目中，然后引入 runtime starter：

适用于 Amazon Bedrock AgentCore 的 Spring AI SDK 现已正式可用

适用于 Amazon Bedrock AgentCore 的 Spring AI SDK 现已正式可用

理解 AgentCore Runtime 契约

解决方案概览

创建你的第一个 AI 智能体

步骤 1：添加 SDK 依赖

Join the discussion