2026-04-21 AI编程CodexAgent协作工作流

为什么我最后选择了「先讨论，再让 Agent 动手」

我今天不讲什么

不讲安装教程。不讲模型横评。不讲工具大全。

只讲一件事：我在真实工作里，试过几种方式之后，最后留下了什么。

我不是天然就反对重工作流的。我用过 superpowers、openspec 这类工具，它们确实能帮你把任务结构化，让 Agent 按步骤走。

但在真实工作里，我撞上了一个问题：工作流一旦跑偏，成本非常高。

不是”多改几次”这么简单。偏一点可能影响接口设计、数据结构、上下游对接。而且这类工作流本身就会消耗大量 token。spec、plan、分步执行，每一步都在吃 token，再加上跑偏后的修正，消耗会翻倍。

问题不是工作流不高级，而是它们在真实工作里还没有很好解决跑偏的问题。

demo 里跑偏了，改一下就好。真实项目里跑偏了，后面一串东西都要跟着调。尤其是跨文件、跨模块的任务，偏航的影响会被放大。越复杂的工作流，偏航的概率和代价都更高。

重工作流本身的 token 消耗也是现实成本。对个人开发者来说，这是不得不算的账。

以前我的做法是：写好 prompt → 丢给 Agent → 看结果 → 修。

现在变成了：先和 Agent 讨论清楚 → 确认方向 → 再执行。

具体来说，动手之前我会先做四件事：

我现在越来越觉得，Agent 最重要的能力不是会不会写，而是动手之前能不能先对齐。

表面上看，先讨论多花了几分钟，好像拖慢了节奏。

但实际体感是：多花 3 分钟对齐，少花 30 分钟返工。大部分返工不是模型能力不够，而是前面没对齐。尤其在跨文件、跨模块的任务里，这个差距会被放大。

真正贵的不是多聊几句，而是没聊明白就直接开干。

Agent 对我来说不只是代码生成器。

Agent 不只是替我写代码，而是一个需要先对齐、再协作的工作搭子。

Claude Code 我有订阅，也实际用过。模型能力没问题。

但我撞上的真实问题是：额度太少。 一个大任务还没做完，额度就见底了。在真实工作里，做到一半断掉，这种体验很伤。不是模型不行，是撑不住完整任务。

Codex 对我更合适的原因很实际：有独立的 App，不需要额外折腾环境；能撑住一个完整任务，不用做到一半停下来。它更自然地进入了我的日常工作流。

工具好不好，不只是看能力上限，还要看它能不能撑住真实工作的连续性。

我越来越离不开 Codex，不是因为它只会写代码。它已经开始帮我处理很多系统问题——进程、端口、性能、链路排查这类事。

遇到问题时，我不是自己先一通乱查，而是先把现象和上下文讲清楚，再让 Codex 去排。它不是盲查，而是带着目标去查。

从系统排障开始，我慢慢发现它已经不只是代码助手。它能进入我的整个工作环境，操作我不熟悉的工具、处理我不想花时间学的流程。查进程、查端口、查链路、甚至直接操作 GUI 应用。

我越来越觉得：Codex 已经开始接管我的电脑了。

它从帮我查进程、排链路开始，慢慢进入了我的整个工作环境。到现在我越来越觉得，它已经开始接管我的电脑了。这个体感和”让 AI 写段代码”完全不一样。

我越来越不相信”流程越完整越好”，我更相信”先讨论清楚，再让 Agent 动手”。

三个要点：

AI 编程最怕的不是不会写，而是还没对齐就直接开干。