LJ.

Token 计费:AI 使用成本揭秘

AI 工具·

一句话介绍

Token 是 AI 模型的计量单位,就像买电按度数算、打车按公里算一样,用 AI 就是按 Token 算。

它解决什么问题

刚开始用 AI 的时候,你可能只关心"能不能用"。但当你想频繁使用、接入 API、或者搭建自己的 AI 应用时,成本就成了不得不考虑的问题。

一句简单的"帮我写篇文章"可能花几毛钱,但如果你让 AI 分析一整本书、处理上千条数据、或者生成长视频,账单可能会让你吓一跳。

理解 Token 计费的本质,能帮你:

  • 知道自己的钱花在哪里
  • 选择最适合的 AI 服务
  • 优化使用方式,少花冤枉钱
  • 预估项目成本,避免超支

核心特点

1. Token 就是"文字块"

AI 不是按字数收费,而是按 Token。可以把 Token 理解为"文字碎片":

  • 英文:大约 1 个单词 = 1-2 个 Token("Hello" = 1 Token)
  • 中文:大约 1 个字 = 2-3 个 Token("你好" ≈ 4-6 Token)
  • 代码:符号也算,if (x > 0) 可能是 5-6 个 Token

为什么这么算?
因为 AI 模型内部把文本拆成小块处理,每一块就是一个 Token。你可以在 OpenAI 的 Tokenizer 工具 里试试,输入一段话立刻看到对应多少 Token。

2. 输入和输出分开计费

AI 计费分两部分:

  • 输入 Token(Input):你发送给 AI 的内容(问题 + 上下文)
  • 输出 Token(Output):AI 回复的内容

通常输出比输入贵 5-10 倍,因为 AI 生成文本比理解文本更耗计算资源。

举个例子(GPT-5.2):

  • 输入:$1.75 / 百万 Token(约 ¥12 / 百万 Token)
  • 输出:$14.00 / 百万 Token(约 ¥96 / 百万 Token)

如果你问一个 500 Token 的问题,AI 回答 2000 Token,成本计算:

输入:500 × $1.75 / 1,000,000 = $0.000875
输出:2000 × $14.00 / 1,000,000 = $0.028
总计:约 $0.029(约 ¥0.20)

3. 各家价格差异大

不同 AI 服务的价格差异可以达到 10 倍以上

OpenAI(2026 年 2 月价格):

  • GPT-5.2:输入 $1.75/M,输出 $14/M(旗舰模型)
  • GPT-5 mini:输入 $0.25/M,输出 $2/M(性价比之王)

Anthropic Claude(2026 年 2 月价格):

  • Opus 4.6:输入 $5/M,输出 $25/M(最强智能)
  • Sonnet 4.6:输入 $3/M,输出 $15/M(平衡选择)
  • Haiku 4.5:输入 $1/M,输出 $5/M(速度最快)

开源模型(通过 API 网关):

  • Llama 3、DeepSeek 等:输入输出都在 $0.1-0.5/M,便宜 20-50 倍

价格不等于效果:贵的模型不一定适合你。写日记用 GPT-5.2 就像开跑车买菜,简单任务用 Haiku 或 GPT-5 mini 就够了。

4. 缓存能省 90% 的钱

如果你反复使用相同的上下文(比如处理同一本书、分析同一份数据集),Prompt Caching(提示词缓存) 能帮你大幅省钱。

工作原理:
AI 会记住你上一次发送的内容,下次只需为新增部分付费。

省钱效果(Claude Sonnet 为例):

  • 正常输入:$3/M Token
  • 缓存读取:$0.30/M Token(省 90%

适用场景:

  • 处理长文档(多次提问同一篇论文)
  • 批量任务(用同样的系统提示词处理 100 条数据)
  • 聊天应用(保留上下文的多轮对话)

5. Batch API 打 5 折

如果你的任务不急,可以用 Batch API(批处理):把多个请求打包提交,24 小时内处理完,价格直接打 5 折。

适合场景:

  • 数据分析(处理上千条用户评论)
  • 内容生成(批量生成文章摘要)
  • 模型评估(测试不同提示词效果)

典型使用场景

场景 1:个人聊天用户

需求:每天和 AI 聊几句,问问题、写写文案
推荐:ChatGPT Plus ($20/月) 或 Claude Pro ($17/月)
成本:固定月费,无需担心 Token

场景 2:开发者接入 API

需求:做一个 AI 助手,每天处理 1000 次对话
推荐:用 GPT-5 mini 或 Claude Haiku
成本估算

  • 每次对话平均 1000 Token 输入 + 500 Token 输出
  • GPT-5 mini:(1000×$0.25 + 500×$2) / 1,000,000 × 1000 次 ≈ $1.25/天
  • Claude Haiku:(1000×$1 + 500×$5) / 1,000,000 × 1000 次 ≈ $3.50/天

场景 3:企业级应用

需求:客服机器人,每月处理 100 万次对话
推荐

  1. 用 API 网关(OpenRouter)混用多家模型,降低成本
  2. 简单问题用 Haiku,复杂问题用 Sonnet
  3. 启用缓存和批处理

成本优化策略:

  • 分级模型:80% 简单问题用便宜模型,20% 复杂问题用旗舰模型
  • 缓存常见上下文(FAQ、产品手册)
  • 异步任务用 Batch API

如何快速上手

1. 先搞清楚自己的用量

  • ChatGPT 用户:设置 → Usage → 查看每月消费
  • API 用户:Dashboard → Usage → 看 Token 消耗曲线

2. 选对模型

  • 日常聊天:GPT-5 mini、Claude Haiku(够用且便宜)
  • 写代码、长文本:GPT-5.2、Claude Sonnet(智能且稳定)
  • 顶级需求:GPT-5.2 pro、Claude Opus(贵但强)

3. 省钱技巧清单

精简提示词:少废话,直奔主题("总结这篇文章的核心观点" 比 "请你帮我仔细阅读并详细总结..." 省 Token)
启用缓存:处理长文档时指定缓存参数
批量处理:一次性提交 100 个任务,而不是分 100 次调用
限制输出长度:设置 max_tokens 参数,避免 AI 说废话
用 API 网关:OpenRouter、LiteLLM 自动选最便宜的模型

4. 监控成本

  • 设置预算上限:OpenAI/Claude 后台都可以设月度限额
  • 接收提醒:达到 80% 用量时邮件通知
  • 定期查看账单:每周看一次,发现异常及时调整

总结

Token 计费不复杂,就是"按量付费"。

记住三个要点:

  1. 输出比输入贵,少让 AI 写长篇大论
  2. 缓存和批处理能省一半钱,别浪费
  3. 选对模型最重要,简单任务别用旗舰

推荐指数:⭐⭐⭐⭐⭐(必学知识)

懂了这些,你就能像老司机一样用 AI——既爽又不心疼钱。


下一步该做什么?

  1. OpenAI Tokenizer 试试你的提示词有多少 Token
  2. 查看你的 API 账单,找出最费钱的地方
  3. 读下一篇《API 网关:一个接口调用所有 AI》,学会进一步省钱