执行摘要 Executive Summary
Envision Group
AWS 主要云平台
~500 云用户
2026年4月账单
12个月云费用趋势 vs 预算
云成本总览 Cloud Cost Overview
按 AWS 服务费用分布(当月)
按团队/业务线费用分布
按环境费用分布(Prod/Staging/Dev/QA)
近6月按服务费用变化趋势
计算资源 Compute — EC2 / EKS
EC2 CPU 利用率分布(实例数量)
计费模式:Reserved vs On-Demand vs Spot
超配实例列表(CPU 利用率 < 20%)— 建议 Rightsize
| 实例 ID | 当前规格 | 环境 | CPU 利用率 | 内存利用率 | 月费用 | 建议规格 | 预估节省/月 | 状态 |
|---|
数据库资源 Database — RDS / Aurora
RDS 实例 CPU 利用率(%)
RDS 费用结构
空闲数据库实例(利用率 < 5%,连续30天)
| 实例 ID | 数据库引擎 | 实例规格 | 环境 | CPU 利用率 | 月费用 | 建议操作 |
|---|
非生产环境不必要的 Multi-AZ 配置(建议关闭)
| 实例 ID | 数据库引擎 | 环境 | 当前月费 | 关闭 Multi-AZ 后节省/月 |
|---|
存储资源 Storage — S3 / EBS / Snapshot
S3 存储类分布(TB)
S3 各存储类月费用($)
未挂载 EBS 卷 & 过期 Snapshot — 可直接释放
未挂载 EBS 卷(Unattached Volumes)
28 卷
总容量:12,400 GB | 月浪费:$3,400
这些卷已与实例分离,持续产生费用但无任何使用。建议核实后删除,年节省 $40,800。
过期 EBS Snapshot(> 90 天未使用)
45 个
总容量:8,900 GB | 月浪费:$890
90天以上未使用的快照,建议建立快照生命周期策略,自动清理过期数据。
网络使用 Network Usage
24小时带宽利用率(%)
网络费用结构(月度,$)
数据传输量(月度)
入站流量 (Inbound) — 免费2.1 TB
出站流量 (Outbound to Internet)48.3 TB
CloudFront 加速流量156 TB
跨区域传输 (Cross-Region)12.4 TB
带宽优化分析
CloudFront 覆盖率(目标 90%)78%
平均带宽利用率(峰值 8.4Gbps)34%
VPC Endpoint 覆盖率(S3/DynamoDB)20%
许可证管理 License Management
各软件许可证利用率(%)
许可证费用占比
许可证明细 — 利用率低于 80% 标红预警
| 产品 | 供应商 | 总席位/实例 | 活跃使用 | 利用率 | 月费用 | 浪费金额/月 | 建议 |
|---|
AI & GenAI 成本管理 2025-2026 新兴领域
⚡ 行业洞察(来源:AWS re:Invent 2025 + CloudZero + FinOps Foundation AI WG):
单 Token 价格以每年 >10× 速度下降(LLMflation),但每任务 Token 消耗量爆增(Multi-agent workflow 可达 100万+ tokens/次),
导致企业 AI 总支出持续攀升。"Inference Whale" 现象(少数用户消耗海量算力)已成为 FinOps 的新挑战。
AI 服务月费用趋势($)
AI 费用结构 — 按服务
Token 消耗 — 按团队/应用(M tokens)
GPU 实例利用率(P3/G5 系列)
Inference Whale 识别 — Top 消耗应用(月 Token > 50M)
| 应用/团队 | 使用模型 | 月 Token 消耗 | 月费用 | 占比 | 平均任务类型 | 优化建议 |
|---|
模型选型优化 — 按任务复杂度路由(Model Routing)
最佳实践:任务 → 模型匹配矩阵
| 任务类型 | 推荐模型 | 估算成本 | 当前使用 |
|---|---|---|---|
| 简单 Q&A / 分类 | Claude 3 Haiku | $0.25/M tok | Claude 3.5 Sonnet |
| 代码辅助 | Claude 3.5 Haiku | $1/M tok | Claude 3.5 Sonnet |
| 文档摘要 | Nova Lite | $0.06/M tok | Claude 3 Sonnet |
| 复杂推理/分析 | Claude 3.5 Sonnet | $3/M tok | ✓ 合理 |
💡 通过模型路由优化,预估月节省 $12,400(当前 AI 支出降低约 28%)
AWS re:Invent 2025 最新优化工具
✅ Bedrock 强化微调(RFT)
用小模型替代大模型,精度不降;Nova 2 Lite 微调后可替代 Claude 3 Sonnet
预估推理成本降低 40-60%
用小模型替代大模型,精度不降;Nova 2 Lite 微调后可替代 Claude 3 Sonnet
预估推理成本降低 40-60%
✅ IAM Principal 成本归因(Apr 2026 新功能)
按调用方身份精确拆分 Bedrock 费用到团队/项目
解决"黑盒"AI 费用问题
按调用方身份精确拆分 Bedrock 费用到团队/项目
解决"黑盒"AI 费用问题
✅ Amazon Q Cost Explorer 集成
自然语言查询成本,AI 驱动异常检测和 RI 推荐
FinOps 分析效率提升 >80%
自然语言查询成本,AI 驱动异常检测和 RI 推荐
FinOps 分析效率提升 >80%
FinOps 分析报告 Analysis Report
总优化潜力(含 RI 承诺折扣)
$204,647 / 月
占当月总费用 24.2% | 年化节省:$2,455,764
快速见效(无需RI承诺)
$108,947 / 月
占总费用 12.9%
识别问题数
47 项
涵盖 5 大优化类别
优化建议 & 行动指南 Action Plan
优先级四象限矩阵(影响 × 实施难度)
🔴 高影响 × 低难度(立即行动)
🟠 高影响 × 高难度(重点规划)
🟢 低影响 × 低难度(按需执行)
⚪ 低影响 × 高难度(长期规划)
各类别月度节省潜力($)
节省来源分布
完整行动计划(按优先级排序)
| # | 行动项 | 类别 | 月节省 | 年化节省 | 实施难度 | 预计时间 | 责任团队 | 状态 |
|---|
总节省摘要
快速见效(0-2周)
$49,267/月
RI承诺折扣(1-4周)
$95,700/月
存储 & 网络优化
$42,900/月
License 优化
$16,780/月
合计优化潜力
$204,647/月
年化 $2,455,764
FinOps Ontology — 知识图谱
7 个实体类
9 类关系
— 节点
— 关系边
参考 FinOps Foundation FOCUS 1.2 / OpenCost
本体模型(Classes & Relations)
语义推理示例:
Action[Buy SP]
→ targets EC2
→ consumed by App
→ tagged "AI/Prod"
→ belongsTo BU[AI]
⇒ 节省 $48.5K/月精确归因到 AI 团队 Prod 环境
节点详情
点击图谱中任一节点查看属性、关系与关联实体。
本体设计参考:
本体设计参考:
- FOCUS 1.2 — FinOps Open Cost & Usage Spec
- OpenCost — Kubernetes 成本归因
- FinOps Framework — Inform/Optimize/Operate
- W3C JSON-LD — 可被 LLM Agent 直接消费