企业级 AI Gateway 部署、成本管控与安全防护技术博客系列
介绍如何在 AWS 上以生产级标准部署 LiteLLM AI Gateway,涵盖 ECS Fargate 和 EKS 两种方案,结合 Control Plane / Data Plane 分离架构实现多区域高可用部署。
涵盖成本监控、预算限额、安全防护三个维度,帮助企业实现 AI 投入可预测、AI 资产不被盗用。LiteLLM 实时限额 + AWS Budgets 兜底双保险。
将 LiteLLM 的请求日志和费用数据接入 Amazon QuickSight,构建运维监控 Dashboard,实现 LLM 使用量、费用、性能的可视化分析。
手把手教你如何监控每个 IAM 用户的 Bedrock 花费,设置预算告警,并在超预算时自动阻断访问。
让不原生支持 web search 的 Bedrock Claude 通过 LiteLLM 代理自动执行网页搜索,配合 SearXNG 实现免费搜索增强。