LiteLLM on AWS

企业级 AI Gateway 部署、成本管控与安全防护技术博客系列

Blog 1: LiteLLM 生产级部署:基于 AWS ECS/EKS 的 AI Gateway 架构

介绍如何在 AWS 上以生产级标准部署 LiteLLM AI Gateway,涵盖 ECS Fargate 和 EKS 两种方案,结合 Control Plane / Data Plane 分离架构实现多区域高可用部署。

ECSEKSCloudFormation高可用

Blog 2: 成本管控与安全防护:避免 AI 意外账单,保障业务连续性

涵盖成本监控、预算限额、安全防护三个维度,帮助企业实现 AI 投入可预测、AI 资产不被盗用。LiteLLM 实时限额 + AWS Budgets 兜底双保险。

成本管控安全防护VPC EndpointBudget

Blog 3: LiteLLM + Amazon QuickSight 数据可视化配置手册

将 LiteLLM 的请求日志和费用数据接入 Amazon QuickSight,构建运维监控 Dashboard,实现 LLM 使用量、费用、性能的可视化分析。

QuickSightAthenaS3日志可视化

Blog 4: 利用 AWS Budget 实现 Amazon Bedrock 用量监控与自动中断

手把手教你如何监控每个 IAM 用户的 Bedrock 花费,设置预算告警,并在超预算时自动阻断访问。

AWS BudgetIAM Deny自动阻断Cost Allocation

Blog 5: Bedrock Claude + LiteLLM WebSearch Interception 配置指南

让不原生支持 web search 的 Bedrock Claude 通过 LiteLLM 代理自动执行网页搜索,配合 SearXNG 实现免费搜索增强。

WebSearchSearXNGClaude CodeAgentic