视频讲解
说明
配置第三方 API 的 Claude Code 用户可通过特定环境变量解决 token 消耗暴涨、推理变慢问题。
问题根源: Claude Code 从 2.1.36 版本开始,会在每个 API 请求的系统提示词开头,加入含随机 5 位十六进制 cch 字段的 x-anthropic-billing-header 内容;第三方 API 代理、Bedrock、本地 vLLM 会将其纳入缓存 key 计算,导致每次请求缓存 key 变化,缓存命中率归零,进而引发 token 消耗暴涨、推理变慢。
设计逻辑:Anthropic 自身服务端会跳过该字段计算缓存 key,该字段实际是其通过 Zig 原生层实现的防白嫖机制,用于验证请求是否来自正版 Claude Code,避免用户用订阅价调用任意 API。
解决方法: 用户可在 ~/claude/settings.json 的 env 段添加环境变量:
{
"env": {
"ANTHROPIC_BASE_URL": "https://api.deepseek.com/anthropic",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-pro[1m]",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "deepseek-v4-pro[1m]",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash",
"CLAUDE_CODE_SUBAGENT_MODEL": "deepseek-v4-flash",
"CLAUDE_CODE_EFFORT_LEVEL": "max",
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1",
"CLAUDE_CODE_ATTRIBUTION_HEADER": "0" //添加这行
}
}
重启 Claude Code 后,该字段会被移除,缓存可恢复正常。