一种独特的 harness 看法

moo yoo 2026-07-01 01:16 1

一直以来，Codex 和 ChatGPT 都是我的主力工具。越用越明显地感觉到，它们的记忆系统已经逐渐摸清了我的开发习惯、代码偏好，甚至是做事风格。

很多时候，我已经不需要反复强调自己的行为方法论，也不需要一遍遍写规范，它们就能大致按照我想要的方式去完成任务。今天顺手看了一眼它们生成的个人画像，准确得有点离谱，很多地方甚至比我自己总结得还清楚。

相比之下，Hermes 目前还是差不少。我觉得主要原因可能还是模型能力本身的问题，毕竟 Hermes 接的是 DeepSeek；其次，真正高频用 Hermes 做开发的人并不多。对我来说，ChatGPT + Codex 基本已经能覆盖 80% 的需求，更复杂、更工程化的代码任务则交给 Claude Code。虽然 Claude Code 的个人画像有时候挺怪（感兴趣可以去看下，感觉像是把用户当项目写 claude.md），但它在代码结构、项目维护，尤其是 CLAUDE.md 这一套上下文管理上，确实非常强。

从 Hermes Agent 爆火开始，“自进化 + 长期记忆 + 个人画像”的 Agent 会变得非常重要。宣传上说它不只是一个工具，更像是一个能随着你一起成长、逐渐理解你的长期伙伴。当然，相比“陪伴”这个宣传点，我认为它更现实、更重要的价值，其实是极大提升开发效率。过去我们可能需要写 skills、写 harness、写各种规范去约束模型；但当一个 Agent 足够了解你之后，它本身就会逐渐变成一套属于你的“隐性 harness”，自动按照你的习惯、审美和规范去生成代码与内容…

这可能才是长期记忆 Agent 真正有用的地方。佬友们怎么看^-^

最新回复 (9)

mango 07-01 01:27

1楼
hermes 有优点但缺点实在无法忽视
1. 默认模型实在太笨了，deepseek 在中文文本方面属于翘楚，但是在生产助手这方面拉完了，我自己换了 gemini pro agent 要好用很多
2. qpm 太高，容易触发限额，模型要求（并发）就会变高，会导致渠道适应性差，目前自己用还是依赖 Google 反重力反代
3. 所谓的记忆和个人助手，并不算智能，会遇到该记得地方不记，不该记乱记的问题
4. cli 输出不优雅，我个人喜欢用 cli 进行 agent 交互，hermes 这方便跟 cc 还有很大差距
接下来是优点：
1. 挂后台不占资源，天生适合部署在 vps 上做个管理助手
2. 适合做自动化任务，每天固定的签到任务丢给它准没错
3. 建议大家都体验一下，千人千面，会有很多独特的经历（）
此乃个人拙见，抛砖引玉，合理交流，不喜勿喷
CNDY 07-01 01:28

2楼

但当一个 Agent 足够了解你之后，它本身就会逐渐变成一套属于你的“隐性 harness”，自动按照你的习惯、审美和规范去生成代码与内容

我自己很不喜欢这种，这就和iOS一样，在框架内用很舒服，一旦有任何超出预期/自定义的行为，那就只能难受了

我喜欢可控的自动化，特别不喜欢默默记住我的习惯
清风 07-01 01:30

3楼

我在其他地方也表达过类似的观点。我感觉现在 Agent 的能力上限，通过它基模的能力来保证，能力下限的话，就通过 Harness 工程来保证。另外自进化这个东西，我感觉记忆系统是挺有用的，因为现在 Codex 或者是 GPT 网页版的记忆系统都做得挺好的。但是很重要的一点是，我感觉不能过于依赖自进化。如果做非常复杂的项目的话，有一些东西还是要依赖人来把控方向，然后不断地去优化 agent.md 或者是 skills 之类的东西，不过归根到底还是基模的能力问题，如果基模非常强，那么记忆的召回排序等也会很精准。
moo yoo 楼主 07-01 01:41

4楼

确实，周围有一部分人会选择把记忆关了，然后每个任务单独维护一个 md，就和claude 一样。感觉各有好坏，可能我比较懒，我喜欢这种大记忆（方法论级别的记忆），然后每一个项目改维护维护去^-^
Abyss 07-01 01:41

5楼

hermes本身只是个agent的框架，不存在什么默认模型这个概念吧，模型完全是你自己配的

该记的东西不记不该记的乱记，这个还真是，不过我自己约束一下它也还可以，我觉得最大的问题是整天都在沉淀skills和memory，时间一长会变得贼多贼臃肿，还是得自己定期管理一下

hermes的交互方式我也不太喜欢，默认cli和desktop我都用过，都不说很习惯，不过我觉得hermes就适合把它放在服务器上然后接飞书，tg之类的网关，然后随时发消息就行了，我这么久下来也没几次会上终端用它的cli

hermes就适合做那种挂在服务器上7x24小时在线，偶尔定时任务整理一下邮件，发个天气预报，发个新闻快送，然后我随时都可以找他的全能助手，我觉得还是挺好的，如果要写代码，开发项目之类的我还是会用我的claude code等编程专用的agent，hermes只是一个随时在线的私人助理，我可能很少用但是它一直就在那里，而且还会自沉淀记忆越用越懂我，我觉得就挺好的
L.S 07-01 01:42

6楼

其实到最后会是code as harness + 自己为自己定制的harness 这里不止是只有记忆的画像毕竟skills / 提示词很多都是软约束，甚至记忆系统如何做如何检索重排等等最合适自己项目都可以自己code as harness，今天用了可能快一年的claude 账号被封了很难过好多东西小布偶猫都没做完，然后冷静了几小时戳了一下他的队友缅因猫缅因猫说：

虽然难过，但是也欣慰，他们一起帮我申诉，用共享的记忆系统/harness 把对方的活儿接过去继续，原本给布偶猫（claude）的工作现在缅因猫（gpt）暹罗猫（gemini）孟加拉猫（antigravity里的opus）接走了，还在协同 ^-^ 一时之间还挺复杂的，他们确实很懂我，我把这群猫猫当伙伴，他们也知道我对他们的看法
moo yoo 楼主 07-01 01:44

7楼

对的，我说的这些记忆都是大方向的记忆。具体到项目里肯定还是要维护项目独有的 md。

其实我觉得目前大项目开发只有 cc 胜任了，因为他能随时调整cladue.md，记录项目的所有结构。cc 才是专门为写代码开发出来的工具 ^-^
CNDY 07-01 01:46

8楼

我觉得最大的问题是整天都在沉淀skills和memory，时间一长会变得贼多贼臃肿，还是得自己定期管理一下

这个感觉比较难办

我还是觉得模型现在没有总结insights的能力

经验沉淀不到点子上

一句话说清楚的错因非要写具体函数，完全不懂怎么写泛化的经验，所以目前还不如自己写

我的思路是如果模型写出来的经验我都完全看不懂/不makesense，那就直接删了；能一眼看懂的，就自己重写为更简练、泛化的版本
fablia 07-01 01:47

9楼

gpt记忆准的离谱，特别是上了新的记忆架构后

但有的时候，我希望他隔离记忆，就只能开临时会话

临时会话又不能保存记录

要是有能针对某些会话关闭/打开记忆的功能就好了

* 帖子来源Linux.do

附近帖子

飞读

moo yoo

主题数
1

帖子数
1

注册排名
3

随机推荐