Llama Stack

欢迎使用 Llama Stack，这是一个用于构建生成式 AI 应用的开源框架。

Llama 4 来了！

新闻

Llama Stack 0.2.6 现已可用！请参阅发布说明了解更多详情。

什么是 Llama Stack？

Llama Stack 定义并标准化了将生成式 AI 应用推向市场所需的核心构建模块。它提供了一组统一的 API，并包含领先服务提供商的实现，从而能够在开发和生产环境之间无缝切换。具体来说，它提供了：

我们的目标是提供预打包的实现（即“分发版”），这些实现可以在各种部署环境中运行。Llama Stack 可以协助您完成整个应用开发生命周期——从本地、移动或桌面端开始迭代，并无缝过渡到本地部署或公共云部署。在这一过渡过程中的每个阶段，都可以使用相同的 API 集和相同的开发者体验。

Llama Stack 由一个服务器（包含多个可插拔的 API 提供者）和客户端 SDK（见下文）组成，用于您的应用。服务器可以在多种环境中运行，包括本地（内联）开发、本地部署和云端。客户端 SDK 可用于 Python、Swift、Node 和 Kotlin。

我们提供了适用于不同语言的多种客户端 SDK。

对于一些流行的推理和向量存储提供商，我们提供了一些“适配器”。对于其他 API（特别是安全性和智能体），我们提供了可用于入门的 参考实现。我们预计这个列表会随着时间推移而增长。随着我们对 API 越来越有信心，我们正在慢慢地将更多提供商引入到生态系统中。

推理 API

向量输入输出 API

安全性 API