TomorrowBye | WAKAJA

一句话介绍

Token 是 AI 模型的计量单位，就像买电按度数算、打车按公里算一样，用 AI 就是按 Token 算。

它解决什么问题

刚开始用 AI 的时候，你可能只关心"能不能用"。但当你想频繁使用、接入 API、或者搭建自己的 AI 应用时，成本就成了不得不考虑的问题。

一句简单的"帮我写篇文章"可能花几毛钱，但如果你让 AI 分析一整本书、处理上千条数据、或者生成长视频，账单可能会让你吓一跳。

理解 Token 计费的本质，能帮你：

知道自己的钱花在哪里
选择最适合的 AI 服务
优化使用方式，少花冤枉钱
预估项目成本，避免超支

核心特点

1. Token 就是"文字块"

AI 不是按字数收费，而是按 Token。可以把 Token 理解为"文字碎片"：

英文：大约 1 个单词 = 1-2 个 Token（"Hello" = 1 Token）
中文：大约 1 个字 = 2-3 个 Token（"你好" ≈ 4-6 Token）
代码：符号也算，if (x > 0) 可能是 5-6 个 Token

为什么这么算？
因为 AI 模型内部把文本拆成小块处理，每一块就是一个 Token。你可以在 OpenAI 的 Tokenizer 工具里试试，输入一段话立刻看到对应多少 Token。

2. 输入和输出分开计费

AI 计费分两部分：

输入 Token（Input）：你发送给 AI 的内容（问题 + 上下文）
输出 Token（Output）：AI 回复的内容

通常输出比输入贵 5-10 倍，因为 AI 生成文本比理解文本更耗计算资源。

举个例子（GPT-5.2）：

输入：$1.75 / 百万 Token（约 ¥12 / 百万 Token）
输出：$14.00 / 百万 Token（约 ¥96 / 百万 Token）

如果你问一个 500 Token 的问题，AI 回答 2000 Token，成本计算：

输入：500 × $1.75 / 1,000,000 = $0.000875
输出：2000 × $14.00 / 1,000,000 = $0.028
总计：约 $0.029（约 ¥0.20）

3. 各家价格差异大

不同 AI 服务的价格差异可以达到 10 倍以上：

OpenAI（2026 年 2 月价格）：

GPT-5.2：输入 $1.75/M，输出 $14/M（旗舰模型）
GPT-5 mini：输入 $0.25/M，输出 $2/M（性价比之王）

Anthropic Claude（2026 年 2 月价格）：

Opus 4.6：输入 $5/M，输出 $25/M（最强智能）
Sonnet 4.6：输入 $3/M，输出 $15/M（平衡选择）
Haiku 4.5：输入 $1/M，输出 $5/M（速度最快）

开源模型（通过 API 网关）：

Llama 3、DeepSeek 等：输入输出都在 $0.1-0.5/M，便宜 20-50 倍

价格不等于效果：贵的模型不一定适合你。写日记用 GPT-5.2 就像开跑车买菜，简单任务用 Haiku 或 GPT-5 mini 就够了。

4. 缓存能省 90% 的钱

如果你反复使用相同的上下文（比如处理同一本书、分析同一份数据集），Prompt Caching（提示词缓存） 能帮你大幅省钱。

工作原理：
AI 会记住你上一次发送的内容，下次只需为新增部分付费。

省钱效果（Claude Sonnet 为例）：

正常输入：$3/M Token
缓存读取：$0.30/M Token（省 90%）

适用场景：

处理长文档（多次提问同一篇论文）
批量任务（用同样的系统提示词处理 100 条数据）
聊天应用（保留上下文的多轮对话）

5. Batch API 打 5 折

如果你的任务不急，可以用 Batch API（批处理）：把多个请求打包提交，24 小时内处理完，价格直接打 5 折。

适合场景：

数据分析（处理上千条用户评论）
内容生成（批量生成文章摘要）
模型评估（测试不同提示词效果）

典型使用场景

场景 1：个人聊天用户

需求：每天和 AI 聊几句，问问题、写写文案
推荐：ChatGPT Plus ($20/月) 或 Claude Pro ($17/月)
成本：固定月费，无需担心 Token

场景 2：开发者接入 API

需求：做一个 AI 助手，每天处理 1000 次对话
推荐：用 GPT-5 mini 或 Claude Haiku
成本估算：

每次对话平均 1000 Token 输入 + 500 Token 输出
GPT-5 mini：(1000×$0.25 + 500×$2) / 1,000,000 × 1000 次 ≈ $1.25/天
Claude Haiku：(1000×$1 + 500×$5) / 1,000,000 × 1000 次 ≈ $3.50/天

场景 3：企业级应用

需求：客服机器人，每月处理 100 万次对话
推荐：

用 API 网关（OpenRouter）混用多家模型，降低成本
简单问题用 Haiku，复杂问题用 Sonnet
启用缓存和批处理

成本优化策略：

分级模型：80% 简单问题用便宜模型，20% 复杂问题用旗舰模型
缓存常见上下文（FAQ、产品手册）
异步任务用 Batch API

如何快速上手

1. 先搞清楚自己的用量

ChatGPT 用户：设置 → Usage → 查看每月消费
API 用户：Dashboard → Usage → 看 Token 消耗曲线

2. 选对模型

日常聊天：GPT-5 mini、Claude Haiku（够用且便宜）
写代码、长文本：GPT-5.2、Claude Sonnet（智能且稳定）
顶级需求：GPT-5.2 pro、Claude Opus（贵但强）

3. 省钱技巧清单

✅ 精简提示词：少废话，直奔主题（"总结这篇文章的核心观点" 比 "请你帮我仔细阅读并详细总结..." 省 Token）
✅ 启用缓存：处理长文档时指定缓存参数
✅ 批量处理：一次性提交 100 个任务，而不是分 100 次调用
✅ 限制输出长度：设置 max_tokens 参数，避免 AI 说废话
✅ 用 API 网关：OpenRouter、LiteLLM 自动选最便宜的模型

4. 监控成本

设置预算上限：OpenAI/Claude 后台都可以设月度限额
接收提醒：达到 80% 用量时邮件通知
定期查看账单：每周看一次，发现异常及时调整

总结

Token 计费不复杂，就是"按量付费"。

记住三个要点：

输出比输入贵，少让 AI 写长篇大论
缓存和批处理能省一半钱，别浪费
选对模型最重要，简单任务别用旗舰

推荐指数：⭐⭐⭐⭐⭐（必学知识）

懂了这些，你就能像老司机一样用 AI——既爽又不心疼钱。

下一步该做什么？

去 OpenAI Tokenizer 试试你的提示词有多少 Token
查看你的 API 账单，找出最费钱的地方
读下一篇《API 网关：一个接口调用所有 AI》，学会进一步省钱