Python SDK 参考

Shared Types

from llama_stack_client.types import (
    AgentConfig,
    BatchCompletion,
    CompletionMessage,
    ContentDelta,
    Document,
    InterleavedContent,
    InterleavedContentItem,
    Message,
    ParamType,
    QueryConfig,
    QueryResult,
    ReturnType,
    SafetyViolation,
    SamplingParams,
    ScoringResult,
    SystemMessage,
    ToolCall,
    ToolParamDefinition,
    ToolResponseMessage,
    URL,
    UserMessage,
)

Toolgroups

类型

from llama_stack_client.types import (
    ListToolGroupsResponse,
    ToolGroup,
    ToolgroupListResponse,
)

方法

工具

类型

from llama_stack_client.types import ListToolsResponse, Tool, ToolListResponse

方法

ToolRuntime

类型

from llama_stack_client.types import ToolDef, ToolInvocationResult

方法

RagTool

方法

Agent

类型

from llama_stack_client.types import (
    InferenceStep,
    MemoryRetrievalStep,
    ShieldCallStep,
    ToolExecutionStep,
    ToolResponse,
    AgentCreateResponse,
)

方法

Session

类型

from llama_stack_client.types.agents import Session, SessionCreateResponse

方法

Steps

类型

from llama_stack_client.types.agents import StepRetrieveResponse

方法

Turn

类型

from llama_stack_client.types.agents import Turn, TurnCreateResponse

方法

BatchInference

类型

from llama_stack_client.types import BatchInferenceChatCompletionResponse

方法

Datasets

类型

from llama_stack_client.types import (
    ListDatasetsResponse,
    DatasetRetrieveResponse,
    DatasetListResponse,
)

方法

Eval

类型

from llama_stack_client.types import EvaluateResponse, Job

方法

Jobs

类型

from llama_stack_client.types.eval import JobStatusResponse

方法

  • client.eval.jobs.retrieve(job_id, *, benchmark_id) -> EvaluateResponse

  • client.eval.jobs.cancel(job_id, *, benchmark_id) -> None

  • client.eval.jobs.status(job_id, *, benchmark_id) -> Optional[JobStatusResponse]

Inspect

类型

from llama_stack_client.types import HealthInfo, ProviderInfo, RouteInfo, VersionInfo

方法

Inference

类型

from llama_stack_client.types import (
    CompletionResponse,
    EmbeddingsResponse,
    TokenLogProbs,
    InferenceChatCompletionResponse,
    InferenceCompletionResponse,
)

方法

VectorIo

类型

from llama_stack_client.types import QueryChunksResponse

方法

VectorDBs

类型

from llama_stack_client.types import (
    ListVectorDBsResponse,
    VectorDBRetrieveResponse,
    VectorDBListResponse,
    VectorDBRegisterResponse,
)

方法

Models

类型

from llama_stack_client.types import ListModelsResponse, Model, ModelListResponse

方法

PostTraining

类型

from llama_stack_client.types import ListPostTrainingJobsResponse, PostTrainingJob

方法

Job

类型

from llama_stack_client.types.post_training import (
    JobListResponse,
    JobArtifactsResponse,
    JobStatusResponse,
)

方法

Providers

类型

from llama_stack_client.types import ListProvidersResponse, ProviderListResponse

方法

Routes

类型

from llama_stack_client.types import ListRoutesResponse, RouteListResponse

方法

Safety

类型

from llama_stack_client.types import RunShieldResponse

方法

Shields

类型

from llama_stack_client.types import ListShieldsResponse, Shield, ShieldListResponse

方法

SyntheticDataGeneration

类型

from llama_stack_client.types import SyntheticDataGenerationResponse

方法

Telemetry

类型

from llama_stack_client.types import (
    QuerySpansResponse,
    SpanWithStatus,
    Trace,
    TelemetryGetSpanResponse,
    TelemetryGetSpanTreeResponse,
    TelemetryQuerySpansResponse,
    TelemetryQueryTracesResponse,
)

方法

Datasetio

类型

from llama_stack_client.types import PaginatedRowsResult

方法

Scoring

类型

from llama_stack_client.types import ScoringScoreResponse, ScoringScoreBatchResponse

方法

ScoringFunctions

类型

from llama_stack_client.types import (
    ListScoringFunctionsResponse,
    ScoringFn,
    ScoringFunctionListResponse,
)

方法

Benchmarks

类型

from llama_stack_client.types import (
    Benchmark,
    ListBenchmarksResponse,
    BenchmarkListResponse,
)

方法