关于 Loop Engineering 的实践与反思

yunshangzhou 2026-06-28 10:00 1

循环工程 这个思想主要是几个知名的大模型团队成员同一时间提出来的

说白话就是，把开发分为 4 个阶段，

发现问题 ->

开辟几个 git worktree 并行解决开发防止同文件代码污染 ->

新开一个 agnent 做功能验证，防止 yes 幻觉 ->

把上下文内容和核心主旨通过 MCP 存到 linear 、notion 上。在下一次的发现问题中，从 MCP
对应的 issues ID / docs ID 回显上下文。

然后再开/loop 以此往复，直到 agent 发现不了新的问题。

这个工程实践真的能落地么？离开人类的监督范畴，很多没考虑到的边界问题，agent 能够帮忙兜底吗？
国内对应 linear 、notion 的，甚至可以是 github issues/wiki 、feishu CLI 、feishu MCP 以及语雀。尽量靠近团队生态，甚至在敏捷开发的团队里，都不需要把存储上行到这些第三方服务，而是直接在本地开一个 md 文件存储即可。

现在 agent 范式搞不出什么新东西了，本质都是围绕着提示词转悠，重复性地搞出不同的术语来表达同一件事。但这也只是我个人观点，水友们你们怎么看？

最新回复 (19)

zizon 06-28 10:11

1楼

自从 ChatGPT 发明了 prompt 用自然语言生成各种东西之后,人类就彻底抛弃 DSL 了.

往好处想想,这叫不做容易的事.
webcape233 06-28 10:32

2楼

升级了一圈还是 prompt
levn 06-28 10:39

3楼

真正的下一步应该是世界模型，或者说中介模型。步子有点大。
YanSeven 06-28 10:51

4楼

什么 loop 工程，就是个噱头。扯那么多虚头巴脑的玩意儿的，除了 llm 训练能力本身，普通人搞不定。

只要把 llm 的 api 部署上去放出来，说明手册往那边一摆。

所有基于 prompt 和 context 做 llm 应用的各种技巧和噱头概念上的，你往那儿栓条狗，用着用着，这些工程上的技巧性的概念也就自然而然的出来的，那帮人天天搁那咋咋呼呼的，跟神经病一样。

就很自然的开发小技巧，老是要包装成什么石破天惊的定律和理念一样的。
l84 06-28 11:17

5楼

看看 openclaw 的 issue 数量就懂了，loop 噱头太重
hahiru 06-28 11:18

6楼

自从我用 superpowers 搭配 codex ，我就知道什么叫边界。
原本的小项目经过 AI 的多 agent 循环验证+审阅之后就发现 codex 把一个小项目左右脑互博之后变成了分布式负载多租户项目。
一条命令就能榨干限额。
Solix 06-28 11:23

7楼

认真你就输了，这就是美国硅谷那几个老登玩不出新花样提出来的，本质就是提示词，没啥区别
tars13344 06-28 12:19

8楼

@YanSeven #4 真的是什么 skill 什么 mcp 连 openclaw 那种 cron 定时调 API 都能让大家群体高超有时候怀疑是不是 99.999%的人都没认真看过这个 api
Azure99 06-28 12:46

9楼

任务的设计并不只是"玩玩提示词"，像#6 提到的，如果不在任务中定义清楚偏好和边界（比如日抛脚本/自用小项目/大型原型/线上老屎山），让 Agent 按自己理解发挥，做重了/做简单了，都是很正常的。
功能验证也一样，Agent 静态改代码/跑跑单测和 lint/端到端验证，可靠性完全不一样。所谓 Harness 搭的完善程度，也直接决定了 Agent 能把产出验证到什么程度。假设你让人（ Agent ）来改 css ，但是不给浏览器（ playwright+截图）、只能对着代码瞪眼，不是一样完成不好么？
Retas 06-28 12:47

10楼

边界是人类和 AI 一起探索出来的，肯定不是 All in AI 。
AI Agent 的功能和概念迭代快，可以理解为一个工具或者 work flow ，根据项目自己按需使用就行。
从实践中找到了大致的规律，基本能快速上手 AI 领域新出的东西，踩一脚没必要。
heroisuseless 06-28 13:05

11楼

并不能成功。

这么 loop 并不能解决核心架构腐坏问题，补丁越来越多，最终结果就是 bug 越来越难解，直到完全解决不了。

估计接下来就是 Mermaid Engineering ，人来把控整个流程图，然后让 AI 来填空。
JasonYip 06-28 16:45

12楼

思想很好但是对于 token 有限的小团队这套肯定玩不来 token 烧的太快，而且我也比较担心 llm 会被污染的上下文绕进去反复左右脑互搏
sg8011 06-28 16:54

13楼

什么 loop ，什么 goal ，没试过，主要是我的 token 不支持我这么挥霍
Biem 06-28 18:20

14楼

其实就是 token 消耗工程，下一步应该是并行全天候量子碰撞 engineering ，面向 token 消耗造词。反正普罗大众容易骗，时不时弄个 KPI 新词出来，变个法子消耗 token ，向韭菜们证明 AI 逻辑还在，继续信仰充钱买股票，何乐而不为。相信后人的智慧。
HappyAndSmile 06-28 18:38

15楼

@YanSeven 技术圈，尤其是国外的，很喜欢造概念，造名词
charlie21 06-28 20:22

16楼

给 ai 分配任务，分配得越好，项目结束得越早。

而且是需要一个经验丰富且熟悉当前项目的人来分配任务。

在实践上，具体问题具体分析的情况是很多的。

所谓的 loop engineering 基本上是为了圈钱搞出来的概念。没办法：盖因 ai 前景太好了所以新概念层出不穷。投资人的钱想撒出去也要有个由头吧。比如你想造汽车，你声称你拥有一个汽车方面的发明专利，投资人可能无法理解具体哪创新了，但你声称汽车会飞投资人的钱哗哗哗就向你来了，甚至投资人还会庆幸自己终于抓住了一次“罕见”的投资机会。

提出这种概念的人呢才应该反思，毕竟这已经太过于空谈了。但他们不会的，他们还可以反问你 “了解不了解行业动态？你落伍了”。整个行业也应该反思这种现象：这都是傻逼投资人带着热钱在催生出来的畸形发展。但他们也不会的，他们还可能反问你 “本来就是风险投资，一个愿打一个愿挨。愿望是美好的，道路是曲折的”。

曲折固然没错，先驱者也可能被误认为是疯狂的人。苹果公司乔布斯有一则广告就是为了致敬各个行业的先驱者的，Think Different 广告由知名广告公司 TBWA\Chiat\Day 创作。英文原版以 "Here's to the crazy ones"（致疯狂的人）开头，中文经典译文十分动人：“他们特立独行，他们桀骜不驯，他们惹事生非，他们格格不入……”所致敬人物：广告中出现的 17 位历史先驱包括：阿尔伯特·爱因斯坦 (Albert Einstein)、鲍勃·迪伦 (Bob Dylan)、马丁·路德·金 (Martin Luther King Jr.)、理查德·布兰森 (Richard Branson)、约翰·列侬 (John Lennon) 等。

曲折和离奇是不一样的。投资人真的那么傻吗？参考斯坦福诈骗犯的故事：涉案公司生物公司 Theranos ，罪犯伊丽莎白·霍姆斯 (Elizabeth Holmes)，核心骗局：宣称开发出了颠覆性的血检技术，只需在指尖抽取一两滴血，就能在短时间内检测出包括癌症、糖尿病在内的 200 多种疾病。最终结局：技术被证实纯属造假，公司于 2018 年倒闭，霍姆斯于 2022 年被判处 11 年 3 个月的监禁。

怎么说呢，诈骗犯还得看斯坦福大学。人的品格不是在顺境中塑造的，而是在逆境中塑造的；不是在富裕时期塑造的，而是在逆境中塑造的。所以在一个热钱乱飞、投资人扎堆的行业里，真的可能有诈骗犯出现，真的是催生诈骗犯的地方。创新热钱诈骗是联系在一起的。

在实际做事的人的周围，甚至在艰苦环境里坚持做工的人的周围，不容易有诈骗犯出现，不容易滋生诈骗行为。创新做工是联系在一起的。工匠精神在滋养创新的花朵，但所谓的工匠精神要来自真正的工匠。
1273712403 06-28 21:29

17楼

很明显不行的，我之前试过这个
fennu2333 06-29 10:15

18楼

我自己整 Harness （ https://chorus-ai.dev/）的时候，loop 这个概念还没有被炒起来，实际回头看下其实做的事情也确实是 loop ，宏观上 loop 任务细化，规划，执行，交付这个循环，微观上设定了 review 验收对抗循环，保证任务不漂移
seekinglight233 06-29 11:59

19楼

我搞 APP 开发，每次开 goal 模式写好验收标准
然后让 AI 自己操作手机模拟测试验收，这算不算 loop engineering