提供者概览

Llama Stack 的目标是构建一个生态系统，让用户可以轻松地为相同的 API 替换不同的实现。这些示例包括：

LLM 推理提供者（例如，Ollama、Fireworks、Together、AWS Bedrock、Groq、Cerebras、SambaNova、vLLM 等），
向量数据库（例如，ChromaDB、Weaviate、Qdrant、Milvus、FAISS、PGVector、SQLite-Vec 等），
安全提供者（例如，Meta 的 Llama Guard、AWS Bedrock Guardrails 等）

提供者有两种形式：

重要的是，Llama Stack 始终努力为每个 API 提供至少一个完全内联的提供者，以便您可以在本地迭代一个功能齐全的环境。

外部提供者

Llama Stack 支持位于主代码库之外的外部提供者。这使您可以独立创建和维护自己的提供者。有关详情，请参阅外部提供者指南。

使用 LLM 运行多步代理工作流程，包括工具使用、内存 (RAG) 等。

与数据集和数据加载器接口交互。

生成输出（通过推理或代理）并执行评分。

使用 LLM 运行推理。

微调模型。

在系统（而不仅仅是模型）级别对输出应用安全策略。

评估系统输出。

从系统中收集遥测数据。

与 ToolGroup 资源相关联。

向量 IO 指的是对向量数据库的操作，例如添加文档、搜索和删除文档。向量 IO 在检索增强生成 (RAG) 中扮演着关键角色，其中向量 IO 和数据库用于存储和检索文档进行检索。

以下提供者（即数据库）可用于向量 IO：