一句话介绍
Token 是 AI 模型的计量单位,就像买电按度数算、打车按公里算一样,用 AI 就是按 Token 算。
它解决什么问题
刚开始用 AI 的时候,你可能只关心"能不能用"。但当你想频繁使用、接入 API、或者搭建自己的 AI 应用时,成本就成了不得不考虑的问题。
一句简单的"帮我写篇文章"可能花几毛钱,但如果你让 AI 分析一整本书、处理上千条数据、或者生成长视频,账单可能会让你吓一跳。
理解 Token 计费的本质,能帮你:
- 知道自己的钱花在哪里
- 选择最适合的 AI 服务
- 优化使用方式,少花冤枉钱
- 预估项目成本,避免超支
核心特点
1. Token 就是"文字块"
AI 不是按字数收费,而是按 Token。可以把 Token 理解为"文字碎片":
- 英文:大约 1 个单词 = 1-2 个 Token("Hello" = 1 Token)
- 中文:大约 1 个字 = 2-3 个 Token("你好" ≈ 4-6 Token)
- 代码:符号也算,
if (x > 0)可能是 5-6 个 Token
为什么这么算?
因为 AI 模型内部把文本拆成小块处理,每一块就是一个 Token。你可以在 OpenAI 的 Tokenizer 工具 里试试,输入一段话立刻看到对应多少 Token。
2. 输入和输出分开计费
AI 计费分两部分:
- 输入 Token(Input):你发送给 AI 的内容(问题 + 上下文)
- 输出 Token(Output):AI 回复的内容
通常输出比输入贵 5-10 倍,因为 AI 生成文本比理解文本更耗计算资源。
举个例子(GPT-5.2):
- 输入:$1.75 / 百万 Token(约 ¥12 / 百万 Token)
- 输出:$14.00 / 百万 Token(约 ¥96 / 百万 Token)
如果你问一个 500 Token 的问题,AI 回答 2000 Token,成本计算:
输入:500 × $1.75 / 1,000,000 = $0.000875
输出:2000 × $14.00 / 1,000,000 = $0.028
总计:约 $0.029(约 ¥0.20)
3. 各家价格差异大
不同 AI 服务的价格差异可以达到 10 倍以上:
OpenAI(2026 年 2 月价格):
- GPT-5.2:输入 $1.75/M,输出 $14/M(旗舰模型)
- GPT-5 mini:输入 $0.25/M,输出 $2/M(性价比之王)
Anthropic Claude(2026 年 2 月价格):
- Opus 4.6:输入 $5/M,输出 $25/M(最强智能)
- Sonnet 4.6:输入 $3/M,输出 $15/M(平衡选择)
- Haiku 4.5:输入 $1/M,输出 $5/M(速度最快)
开源模型(通过 API 网关):
- Llama 3、DeepSeek 等:输入输出都在 $0.1-0.5/M,便宜 20-50 倍
价格不等于效果:贵的模型不一定适合你。写日记用 GPT-5.2 就像开跑车买菜,简单任务用 Haiku 或 GPT-5 mini 就够了。
4. 缓存能省 90% 的钱
如果你反复使用相同的上下文(比如处理同一本书、分析同一份数据集),Prompt Caching(提示词缓存) 能帮你大幅省钱。
工作原理:
AI 会记住你上一次发送的内容,下次只需为新增部分付费。
省钱效果(Claude Sonnet 为例):
- 正常输入:$3/M Token
- 缓存读取:$0.30/M Token(省 90%)
适用场景:
- 处理长文档(多次提问同一篇论文)
- 批量任务(用同样的系统提示词处理 100 条数据)
- 聊天应用(保留上下文的多轮对话)
5. Batch API 打 5 折
如果你的任务不急,可以用 Batch API(批处理):把多个请求打包提交,24 小时内处理完,价格直接打 5 折。
适合场景:
- 数据分析(处理上千条用户评论)
- 内容生成(批量生成文章摘要)
- 模型评估(测试不同提示词效果)
典型使用场景
场景 1:个人聊天用户
需求:每天和 AI 聊几句,问问题、写写文案
推荐:ChatGPT Plus ($20/月) 或 Claude Pro ($17/月)
成本:固定月费,无需担心 Token
场景 2:开发者接入 API
需求:做一个 AI 助手,每天处理 1000 次对话
推荐:用 GPT-5 mini 或 Claude Haiku
成本估算:
- 每次对话平均 1000 Token 输入 + 500 Token 输出
- GPT-5 mini:(1000×$0.25 + 500×$2) / 1,000,000 × 1000 次 ≈ $1.25/天
- Claude Haiku:(1000×$1 + 500×$5) / 1,000,000 × 1000 次 ≈ $3.50/天
场景 3:企业级应用
需求:客服机器人,每月处理 100 万次对话
推荐:
- 用 API 网关(OpenRouter)混用多家模型,降低成本
- 简单问题用 Haiku,复杂问题用 Sonnet
- 启用缓存和批处理
成本优化策略:
- 分级模型:80% 简单问题用便宜模型,20% 复杂问题用旗舰模型
- 缓存常见上下文(FAQ、产品手册)
- 异步任务用 Batch API
如何快速上手
1. 先搞清楚自己的用量
- ChatGPT 用户:设置 → Usage → 查看每月消费
- API 用户:Dashboard → Usage → 看 Token 消耗曲线
2. 选对模型
- 日常聊天:GPT-5 mini、Claude Haiku(够用且便宜)
- 写代码、长文本:GPT-5.2、Claude Sonnet(智能且稳定)
- 顶级需求:GPT-5.2 pro、Claude Opus(贵但强)
3. 省钱技巧清单
✅ 精简提示词:少废话,直奔主题("总结这篇文章的核心观点" 比 "请你帮我仔细阅读并详细总结..." 省 Token)
✅ 启用缓存:处理长文档时指定缓存参数
✅ 批量处理:一次性提交 100 个任务,而不是分 100 次调用
✅ 限制输出长度:设置 max_tokens 参数,避免 AI 说废话
✅ 用 API 网关:OpenRouter、LiteLLM 自动选最便宜的模型
4. 监控成本
- 设置预算上限:OpenAI/Claude 后台都可以设月度限额
- 接收提醒:达到 80% 用量时邮件通知
- 定期查看账单:每周看一次,发现异常及时调整
总结
Token 计费不复杂,就是"按量付费"。
记住三个要点:
- 输出比输入贵,少让 AI 写长篇大论
- 缓存和批处理能省一半钱,别浪费
- 选对模型最重要,简单任务别用旗舰
推荐指数:⭐⭐⭐⭐⭐(必学知识)
懂了这些,你就能像老司机一样用 AI——既爽又不心疼钱。
下一步该做什么?
- 去 OpenAI Tokenizer 试试你的提示词有多少 Token
- 查看你的 API 账单,找出最费钱的地方
- 读下一篇《API 网关:一个接口调用所有 AI》,学会进一步省钱