一句话总结
作者不是在教“怎么写提示词”,而是在教“怎么设计一条 AI 工程流水线”:让多个 agent 并行探索、互相审查、用测试闭环,再由人做最后判断。
《Every Agentic Engineering Hack I Know》通俗详尽笔记:如何用并行、验证、上下文与低成本模型,把 AI 编程从“偶尔帮忙”变成稳定产出系统。
作者不是在教“怎么写提示词”,而是在教“怎么设计一条 AI 工程流水线”:让多个 agent 并行探索、互相审查、用测试闭环,再由人做最后判断。
别把模型当一个会话窗口。把它当一组便宜、可复制、会犯错但很快的初级工程师;你的工作是拆任务、给标准、验结果。
已经在用 Claude Code、Codex、Cursor、Devin、Copilot 类工具的人。尤其适合需要把 AI 编程引入真实项目和团队流程的工程师。
X 原帖本身很短:Matt Van Horn 只发了一个链接。这个链接指向他的长文《Every Agentic Engineering Hack I Know (June 2026)》。所以这份笔记真正解读的是那篇文章,而不是单条推文。
很多人用 AI 写代码时,会把失败归因于模型不聪明:它没理解需求、改坏了代码、越改越乱、上下文不够、生成结果不能跑。作者的视角更工程化:问题往往不是“模型不够神”,而是我们没有给它搭好工作环境。
一名真实工程师要高效工作,需要需求背景、仓库结构、测试、代码审查、可回滚路径、任务优先级和验收标准。AI agent 也一样。你不给它这些,它就只能靠猜。
这就是文章的主线:AI 不是替代工程纪律,而是放大工程纪律。流程越清楚,agent 越能稳定产出;流程越混乱,模型越容易把混乱自动化。
作者强调并行。传统人类团队里,同一个问题让几个人各自想方案,常常比一个人闷头想更可靠。AI agent 的成本低、启动快,所以更适合并行。
很多人一遇到 AI 犯错,就想把更多文件、更多文档、更多背景全部塞进去。作者的经验相反:上下文要“够用且准确”,不是堆满。
| 上下文类型 | 应该给什么 | 不该给什么 |
|---|---|---|
| 任务背景 | 目标、用户路径、边界、验收标准 | 长篇会议纪要、无关历史争论 |
| 代码上下文 | 相关模块、调用链、已有模式、测试入口 | 整个仓库一股脑贴入 |
| 设计约束 | 性能、安全、兼容、样式系统、迁移策略 | 含糊的“做得好一点” |
| 输出格式 | 需要补丁、计划、审查、命令还是文档 | 让 agent 自己猜交付物 |
好的上下文像导航图,告诉 agent 该看哪里、别碰哪里、做完怎么算对。坏的上下文像仓库大甩卖,信息很多,但方向很少。
Agent 生成代码时最危险的地方,不是它会犯错,而是它会很自信地犯错。作者反复强调,必须让验证成为默认动作。
这套思路的本质是:不要追求模型一次完美,而是设计一个系统,让错误尽早暴露、低成本暴露、可重复暴露。
文章提到成本意识:不是所有任务都需要最强模型。很多工程动作其实是机械的,比如整理日志、改重复样板、补测试模板、提取结构化信息。把这些交给便宜模型或脚本,能显著降低成本。
| 任务 | 适合的资源 | 原因 |
|---|---|---|
| 重命名、格式化、批量替换 | 脚本或低成本模型 | 规则明确,创造性低 |
| 初版实现、样板代码 | 中等模型 | 需要理解结构,但可由测试兜底 |
| 架构取舍、安全边界 | 强模型 + 人类复核 | 需要跨上下文判断,错误代价高 |
| 最终合并决策 | 人类负责人 | 涉及产品目标、长期维护和团队责任 |
如果你每次都手动告诉 agent “先读 README、再跑测试、不要乱改无关文件”,那说明流程还没有产品化。作者的思路是把反复出现的有效做法固化:
项目约定、架构边界、测试命令、部署方式,应该成为 agent 默认读取的工作记忆。
复杂但固定的操作不要每次让模型重写,封装为 CLI 或脚本更可靠。
PR 描述、测试计划、迁移清单、回滚方案都适合模板化。
高频领域任务可以做成 agent skill,让未来的 agent 自动遵循流程。
下面是一套普通工程师明天就能试的流程,不需要等公司重构全部研发体系。
| 误区 | 为什么危险 | 更好的做法 |
|---|---|---|
| 把整个仓库丢给模型 | 噪声太多,注意力分散 | 先让它用搜索定位相关文件 |
| 模型说通过就相信 | 它可能没真正运行测试 | 要求给出实际命令和输出 |
| 一次性让它做完大需求 | 错误会层层叠加 | 拆成可验证的小阶段 |
| 只让写代码,不让审查 | 生成者容易维护自己的错误 | 使用独立审查 agent |
| 每次从零开始讲规则 | 浪费时间且不稳定 | 沉淀项目记忆、脚本和模板 |
任务卡 并行方案 独立审查 测试优先 截图验证 小步提交 成本分层 经验沉淀
本页是中文结构化阅读笔记,不是逐字翻译;为遵守版权,只保留少量概括性转述,并把重点放在方法论、实践路径和可执行清单。