省token策略

核心思路是减少模型的不确定性探索和冗余输出

1. 精准提问,减少往返

2. 利用编辑与续写能力

|工具 |续写方式 |适用场景 |---|---|---| |Cursor / Copilot |行内灰色补全,Tab 接受 |单行或小片段 Claude Code |分析上下文后生成完整函数/模块 |需要理解依赖关系的多行续写

Claude Code 的“续写”更多发生在跨文件场景——比如修改了一个类型定义,让 Claude 自动更新所有引用该类型的文件。

3. 选择高效交互模式

4. 管理对话历史

5. 利用模型特性

  • 设置输出上限:在API中合理设置max_tokens,避免模型过度解释。