关于 Loop Engineering 的实践与反思

yunshangzhou 2026-06-28 10:00 1

循环工程 这个思想主要是几个知名的大模型团队成员同一时间提出来的


说白话就是,把开发分为 4 个阶段,



  1. 发现问题 ->

  2. 开辟几个 git worktree 并行解决开发防止同文件代码污染 ->

  3. 新开一个 agnent 做功能验证,防止 yes 幻觉 ->

  4. 把上下文内容和核心主旨通过 MCP 存到 linear 、notion 上。在下一次的发现问题中,从 MCP
    对应的 issues ID / docs ID 回显上下文。


然后再开/loop 以此往复,直到 agent 发现不了新的问题。


这个工程实践真的能落地么?离开人类的监督范畴,很多没考虑到的边界问题,agent 能够帮忙兜底吗?
国内对应 linear 、notion 的,甚至可以是 github issues/wiki 、feishu CLI 、feishu MCP 以及语雀。尽量靠近团队生态,甚至在敏捷开发的团队里,都不需要把存储上行到这些第三方服务,而是直接在本地开一个 md 文件存储即可。


现在 agent 范式搞不出什么新东西了,本质都是围绕着提示词转悠,重复性地搞出不同的术语来表达同一件事。但这也只是我个人观点,水友们你们怎么看?

最新回复 (19)
  • zizon 06-28 10:11
    1
    自从 ChatGPT 发明了 prompt 用自然语言生成各种东西之后,人类就彻底抛弃 DSL 了.

    往好处想想,这叫不做容易的事.
  • webcape233 06-28 10:32
    2
    升级了一圈 还是 prompt
  • levn 06-28 10:39
    3
    真正的下一步应该是世界模型,或者说中介模型。步子有点大。
  • YanSeven 06-28 10:51
    4
    什么 loop 工程,就是个噱头。扯那么多虚头巴脑的玩意儿的,除了 llm 训练能力本身,普通人搞不定。

    只要把 llm 的 api 部署上去放出来,说明手册往那边一摆。

    所有基于 prompt 和 context 做 llm 应用的各种技巧和噱头概念上的,你往那儿栓条狗,用着用着,这些工程上的技巧性的概念也就自然而然的出来的,那帮人天天搁那咋咋呼呼的,跟神经病一样。

    就很自然的开发小技巧,老是要包装成什么石破天惊的定律和理念一样的。
  • l84 06-28 11:17
    5
    看看 openclaw 的 issue 数量就懂了,loop 噱头太重
  • hahiru 06-28 11:18
    6
    自从我用 superpowers 搭配 codex ,我就知道什么叫边界。
    原本的小项目经过 AI 的多 agent 循环验证+审阅之后就发现 codex 把一个小项目左右脑互博之后变成了分布式负载多租户项目。
    一条命令就能榨干限额。
  • Solix 06-28 11:23
    7
    认真你就输了,这就是美国硅谷那几个老登玩不出新花样提出来的,本质就是提示词,没啥区别
  • tars13344 06-28 12:19
    8
    @YanSeven #4 真的是 什么 skill 什么 mcp 连 openclaw 那种 cron 定时调 API 都能让大家群体高超 有时候怀疑是不是 99.999%的人都没认真看过这个 api
  • Azure99 06-28 12:46
    9
    任务的设计并不只是"玩玩提示词",像#6 提到的,如果不在任务中定义清楚偏好和边界(比如 日抛脚本/自用小项目/大型原型/线上老屎山),让 Agent 按自己理解发挥,做重了/做简单了,都是很正常的。
    功能验证也一样,Agent 静态改代码/跑跑单测和 lint/端到端验证,可靠性完全不一样。所谓 Harness 搭的完善程度,也直接决定了 Agent 能把产出验证到什么程度。假设你让人( Agent )来改 css ,但是不给浏览器( playwright+截图)、只能对着代码瞪眼,不是一样完成不好么?
  • Retas 06-28 12:47
    10
    边界是人类和 AI 一起探索出来的,肯定不是 All in AI 。
    AI Agent 的功能和概念迭代快,可以理解为一个工具或者 work flow ,根据项目自己按需使用就行。
    从实践中找到了大致的规律,基本能快速上手 AI 领域新出的东西,踩一脚没必要。
  • heroisuseless 06-28 13:05
    11
    并不能成功。

    这么 loop 并不能解决核心架构腐坏问题,补丁越来越多,最终结果就是 bug 越来越难解,直到完全解决不了。

    估计接下来就是 Mermaid Engineering ,人来把控整个流程图,然后让 AI 来填空。
  • JasonYip 06-28 16:45
    12
    思想很好 但是对于 token 有限的小团队这套肯定玩不来 token 烧的太快,而且我也比较担心 llm 会被污染的上下文绕进去反复左右脑互搏
  • sg8011 06-28 16:54
    13
    什么 loop ,什么 goal ,没试过,主要是我的 token 不支持我这么挥霍
  • Biem 06-28 18:20
    14
    其实就是 token 消耗工程,下一步应该是并行全天候量子碰撞 engineering ,面向 token 消耗造词。反正普罗大众容易骗,时不时弄个 KPI 新词出来,变个法子消耗 token ,向韭菜们证明 AI 逻辑还在,继续信仰充钱买股票,何乐而不为。相信后人的智慧。
  • HappyAndSmile 06-28 18:38
    15
    @YanSeven 技术圈,尤其是国外的,很喜欢造概念,造名词
  • charlie21 06-28 20:22
    16
    给 ai 分配任务,分配得越好,项目结束得越早。

    而且是需要一个经验丰富且熟悉当前项目的人来分配任务。

    在实践上,具体问题具体分析的情况是很多的。

    所谓的 loop engineering 基本上是为了圈钱搞出来的概念。没办法:盖因 ai 前景太好了 所以新概念层出不穷。投资人的钱想撒出去也要有个由头吧。比如你想造汽车,你声称你拥有一个汽车方面的发明专利,投资人可能无法理解具体哪创新了,但你声称汽车会飞 投资人的钱哗哗哗就向你来了,甚至投资人还会庆幸自己终于抓住了一次“罕见”的投资机会。

    提出这种概念的人呢才应该反思,毕竟这已经太过于空谈了。但他们不会的,他们还可以反问你 “了解不了解行业动态?你落伍了”。整个行业也应该反思这种现象:这都是傻逼投资人带着热钱在催生出来的畸形发展。但他们也不会的,他们还可能反问你 “本来就是风险投资,一个愿打一个愿挨。愿望是美好的,道路是曲折的”。

    曲折固然没错,先驱者也可能被误认为是疯狂的人。苹果公司乔布斯有一则广告就是为了致敬各个行业的先驱者的,Think Different 广告由知名广告公司 TBWA\Chiat\Day 创作。英文原版以 "Here's to the crazy ones"(致疯狂的人)开头,中文经典译文十分动人:“他们特立独行,他们桀骜不驯,他们惹事生非,他们格格不入……”所致敬人物:广告中出现的 17 位历史先驱包括:阿尔伯特·爱因斯坦 (Albert Einstein)、鲍勃·迪伦 (Bob Dylan)、马丁·路德·金 (Martin Luther King Jr.)、理查德·布兰森 (Richard Branson)、约翰·列侬 (John Lennon) 等。

    曲折和离奇是不一样的。投资人真的那么傻吗?参考斯坦福诈骗犯的故事:涉案公司 生物公司 Theranos ,罪犯伊丽莎白·霍姆斯 (Elizabeth Holmes),核心骗局:宣称开发出了颠覆性的血检技术,只需在指尖抽取一两滴血,就能在短时间内检测出包括癌症、糖尿病在内的 200 多种疾病。最终结局:技术被证实纯属造假,公司于 2018 年倒闭,霍姆斯于 2022 年被判处 11 年 3 个月的监禁。

    怎么说呢,诈骗犯还得看斯坦福大学。人的品格不是在顺境中塑造的,而是在逆境中塑造的;不是在富裕时期塑造的,而是在逆境中塑造的。所以 在一个热钱乱飞、投资人扎堆的行业里,真的可能有诈骗犯出现,真的是催生诈骗犯的地方。创新 热钱 诈骗 是联系在一起的。

    在实际做事的人的周围,甚至在艰苦环境里坚持做工的人的周围,不容易有诈骗犯出现,不容易滋生诈骗行为。创新 做工 是联系在一起的。工匠精神在滋养创新的花朵,但所谓的工匠精神要来自真正的工匠。
  • 1273712403 06-28 21:29
    17
    很明显不行的,我之前试过这个
  • fennu2333 06-29 10:15
    18
    我自己整 Harness ( https://chorus-ai.dev/) 的时候,loop 这个概念还没有被炒起来,实际回头看下其实做的事情也确实是 loop ,宏观上 loop 任务细化,规划,执行,交付这个循环,微观上设定了 review 验收对抗循环,保证任务不漂移
  • seekinglight233 06-29 11:59
    19
    我搞 APP 开发,每次开 goal 模式写好验收标准
    然后让 AI 自己操作手机模拟测试验收,这算不算 loop engineering
* 帖子来源V2EX
返回