一种独特的 harness 看法

moo yoo 2026-07-01 01:16 1

一直以来,Codex 和 ChatGPT 都是我的主力工具。越用越明显地感觉到,它们的记忆系统已经逐渐摸清了我的开发习惯、代码偏好,甚至是做事风格。


很多时候,我已经不需要反复强调自己的行为方法论,也不需要一遍遍写规范,它们就能大致按照我想要的方式去完成任务。今天顺手看了一眼它们生成的个人画像,准确得有点离谱,很多地方甚至比我自己总结得还清楚。


相比之下,Hermes 目前还是差不少。我觉得主要原因可能还是模型能力本身的问题,毕竟 Hermes 接的是 DeepSeek;其次,真正高频用 Hermes 做开发的人并不多。对我来说,ChatGPT + Codex 基本已经能覆盖 80% 的需求,更复杂、更工程化的代码任务则交给 Claude Code。虽然 Claude Code 的个人画像有时候挺怪(感兴趣可以去看下,感觉像是把用户当项目写 claude.md),但它在代码结构、项目维护,尤其是 CLAUDE.md 这一套上下文管理上,确实非常强。


从 Hermes Agent 爆火开始,“自进化 + 长期记忆 + 个人画像”的 Agent 会变得非常重要。宣传上说它不只是一个工具,更像是一个能随着你一起成长、逐渐理解你的长期伙伴。当然,相比“陪伴”这个宣传点,我认为它更现实、更重要的价值,其实是极大提升开发效率。过去我们可能需要写 skills、写 harness、写各种规范去约束模型;但当一个 Agent 足够了解你之后,它本身就会逐渐变成一套属于你的“隐性 harness”,自动按照你的习惯、审美和规范去生成代码与内容…


这可能才是长期记忆 Agent 真正有用的地方。佬友们怎么看^-^

最新回复 (9)
  • mango 07-01 01:27
    1

    hermes 有优点但缺点实在无法忽视



    1. 默认模型实在太笨了,deepseek 在中文文本方面属于翘楚,但是在生产助手这方面拉完了,我自己换了 gemini pro agent 要好用很多

    2. qpm 太高,容易触发限额,模型要求(并发)就会变高,会导致渠道适应性差,目前自己用还是依赖 Google 反重力反代

    3. 所谓的记忆和个人助手,并不算智能,会遇到该记得地方不记,不该记乱记的问题

    4. cli 输出不优雅,我个人喜欢用 cli 进行 agent 交互,hermes 这方便跟 cc 还有很大差距


    接下来是优点:



    1. 挂后台不占资源,天生适合部署在 vps 上做个管理助手

    2. 适合做自动化任务,每天固定的签到任务丢给它准没错

    3. 建议大家都体验一下,千人千面,会有很多独特的经历()


    此乃个人拙见,抛砖引玉,合理交流,不喜勿喷

  • CNDY 07-01 01:28
    2

    但当一个 Agent 足够了解你之后,它本身就会逐渐变成一套属于你的“隐性 harness”,自动按照你的习惯、审美和规范去生成代码与内容



    我自己很不喜欢这种,这就和iOS一样,在框架内用很舒服,一旦有任何超出预期/自定义的行为,那就只能难受了


    我喜欢可控的自动化,特别不喜欢默默记住我的习惯

  • 清风 07-01 01:30
    3

    我在其他地方也表达过类似的观点。我感觉现在 Agent 的能力上限,通过它基模的能力来保证,能力下限的话,就通过 Harness 工程来保证。另外自进化这个东西,我感觉记忆系统是挺有用的,因为现在 Codex 或者是 GPT 网页版的记忆系统都做得挺好的。但是很重要的一点是,我感觉不能过于依赖自进化。如果做非常复杂的项目的话,有一些东西还是要依赖人来把控方向,然后不断地去优化 agent.md 或者是 skills 之类的东西,不过归根到底还是基模的能力问题,如果基模非常强,那么记忆的召回排序等也会很精准。

  • moo yoo 楼主 07-01 01:41
    4

    确实,周围有一部分人会选择把记忆关了,然后每个任务单独维护一个 md,就和claude 一样。感觉各有好坏,可能我比较懒,我喜欢这种大记忆(方法论级别的记忆),然后每一个项目改维护维护去^-^

  • Abyss 07-01 01:41
    5

    hermes本身只是个agent的框架,不存在什么默认模型这个概念吧,模型完全是你自己配的


    该记的东西不记不该记的乱记,这个还真是,不过我自己约束一下它也还可以,我觉得最大的问题是整天都在沉淀skills和memory,时间一长会变得贼多贼臃肿,还是得自己定期管理一下


    hermes的交互方式我也不太喜欢,默认cli和desktop我都用过,都不说很习惯,不过我觉得hermes就适合把它放在服务器上然后接飞书,tg之类的网关,然后随时发消息就行了,我这么久下来也没几次会上终端用它的cli


    hermes就适合做那种挂在服务器上7x24小时在线,偶尔定时任务整理一下邮件,发个天气预报,发个新闻快送,然后我随时都可以找他的全能助手,我觉得还是挺好的,如果要写代码,开发项目之类的我还是会用我的claude code等编程专用的agent,hermes只是一个随时在线的私人助理,我可能很少用但是它一直就在那里,而且还会自沉淀记忆越用越懂我,我觉得就挺好的

  • L.S 07-01 01:42
    6

    其实到最后会是code as harness + 自己为自己定制的harness 这里不止是只有记忆的画像毕竟skills / 提示词 很多都是软约束,甚至记忆系统如何做如何检索 重排 等等最合适自己项目都可以自己code as harness,今天用了可能快一年的claude 账号被封了很难过好多 东西小布偶猫都没做完,然后冷静了几小时 戳了一下 他的队友缅因猫 缅因猫说:


    虽然难过,但是也欣慰,他们一起帮我申诉,用共享的记忆系统/harness 把对方的活儿接过去继续,原本给布偶猫(claude)的工作现在缅因猫(gpt)暹罗猫(gemini)孟加拉猫(antigravity里的opus)接走了,还在协同 ^-^ 一时之间 还挺复杂的,他们确实很懂我,我把这群猫猫当伙伴,他们也知道我对他们的看法

  • moo yoo 楼主 07-01 01:44
    7

    对的,我说的这些记忆都是大方向的记忆。具体到项目里肯定还是要维护项目独有的 md。

    其实我觉得目前大项目开发只有 cc 胜任了,因为他能随时调整cladue.md,记录项目的所有结构。cc 才是专门为写代码开发出来的工具 ^-^

  • CNDY 07-01 01:46
    8

    我觉得最大的问题是整天都在沉淀skills和memory,时间一长会变得贼多贼臃肿,还是得自己定期管理一下



    这个感觉比较难办


    我还是觉得模型现在没有总结insights的能力


    经验沉淀不到点子上


    一句话说清楚的错因非要写具体函数,完全不懂怎么写泛化的经验,所以目前还不如自己写


    我的思路是如果模型写出来的经验我都完全看不懂/不makesense,那就直接删了;能一眼看懂的,就自己重写为更简练、泛化的版本

  • fablia 07-01 01:47
    9

    gpt记忆准的离谱,特别是上了新的记忆架构后

    但有的时候,我希望他隔离记忆,就只能开临时会话

    临时会话又不能保存记录

    要是有能针对某些会话关闭/打开记忆的功能就好了

* 帖子来源Linux.do
返回