这么长的对话,上下文不断压缩,会影响 AI 智商吗?

始皇帝 2026-07-04 13:16 1


怎么做比较好?

如果是新开对话的话,让他重新读当前项目的文档可以提升吗?

最新回复 (19)
  • cost 07-04 13:18
    1

    如果都是在干同一件事我觉得问题不大,如果是不同的话其实会有影响。

  • SH 07-04 13:19
    2

    效果可能没有全量上下文好,但肯定是不会影响智商的。

  • lanvv 07-04 13:19
    3

    codex 感觉影响不大 就是每次打开会卡卡的 就让他完整总结下 新开个文档继续了 然后就是看怎么总结了 要把 todo 待验证等分类总结好

  • 始皇帝 楼主 07-04 13:20
    4



    我一般是一步步的先让他做项目规划和文档,这就积累了很多对话了。

    然后再当前对话里设置目标模式,让他完成当前的规划

  • 始皇帝 楼主 07-04 13:21
    5

    对,是的,点到这个对话就是卡卡的,特别是上下翻动的时候

  • undefined 07-04 13:24
    6

    我昨天把gpt5.5弄的会话让glm接着做,结果glm5.2说权限混乱做不下去,然后给了我个总结,让新开会话贴总结就可以继续做了。结果挺完美的。用的claude code接的上面俩大模型。

  • 始皇帝 楼主 07-04 13:26
    7

    啊,多个不同的 AI 接续同一个项目,他们不会混乱吗?他们各个 AI 不会出各自的屎山代码吗?

  • undefined 07-04 13:27
    8

    会乱。别几个同时接就没事。

    同时接绝对都愣逼了。

  • DrNoir 07-04 13:28
    9

    会的,上下文压缩的本质其实就是一段提示词,告诉大模型去看你的 session 里面有哪些重点,把重点提炼出来,必然会损失信息

  • He110 07-04 13:28
    10

    其实主要的是,上下文内容跟实际任务有没有关联,以及模型的注意力机制,有些模型会关注起始+结束,中间的权重降低,这种情况下压缩了清理掉一些不重要内容会好一些,这也是为什么很多 agent 默认在达到阈值(一般在 200-300k)会自动压缩,即使上下文是支持 1M 的也会做自动压缩。


    但是话又说来回,压缩后会有比较高的缓存丢失问题,大量缓存失效,费用会更高一些,而且如果有些细节的内容,可能会随着压缩导致细节丢失,如果细节很重要,不建议压缩,或者要求其先整理一份知识文档、任务进度之类的内容,方便压缩后继续处理任务。


    但是又说回来,其实有文档的话直接新开一个会话也 OK 的,反正都是大量缓存失效 + 知识重新读取。

  • semghh9 07-04 13:30
    11

    一定会有问题的。压缩代表丢上下文。我们不清楚到底是怎么做的压缩(到底丢了哪些东西)。


    会增加出现幻觉的概率的。


    长的、复杂的任务 一定要拆解。 subagent一定程度上可以帮助解决这个问题。


    另外很多agent提供了 fork功能,可以很方便迁移啊。为什么要全写在一起一坨。

  • Enze 07-04 13:32
    12

    看着像网页对话,真正交互的对话我很少会让它进行到这么长,几个来回之后我就会让它总结出一份不依赖当前上下文的文档然后去开新对话了

  • Duncan Lean 07-04 13:33
    13

    压缩的本质是去除废话,只保留最后的结论。


    比如,一开始你希望的是A效果,但之后你不满意换成了B效果。

    有些模型会只保留你用了B效果,有些模型会记住你先前尝试过A效果,但不满意,然后换成了B效果

  • 始皇帝 楼主 07-04 13:36
    14

    佬,这个怎么做?我已经设置了整个文档的目标任务。还有办法拆解重新用 subagent 吗

  • 始皇帝 楼主 07-04 13:38
    15

    我看 codex 在设置目标任务后,也是一个个阶段的分开来做。这属于自动拆解了吗?

  • semghh9 07-04 13:41
    16

    假设你有一个复杂的任务。最好要让每个thread都带上任务的总结描述(比如 需求背景、技术偏好、一些总纲形式的内容),你甚至可以先单独起一个thread让AI先做提炼总结。


    让一个thread帮你做总规划,任务拆解。


    剩下的每一个单独的subagent都完成某个具体任务。

    带上提示词 “前1、2、3…任务已经做完了,你需要参考现有代码和总规划完成xxx任务即可”

  • DrNoir 07-04 13:41
    17

    你可以直接告诉他,调用子智能完成xx阶段,让他注入相应的上下文给子智能体,还有检测的标准,测试通过以后返回结果给编排的agent就可以,编排这个agent就没那么多执行的上下文膨胀污染

  • semghh9 07-04 13:41
    18

    最新版的codex 已经可以看到 context占用了。 都在一个context就不属于拆解。

  • 始皇帝 楼主 07-04 13:46
    19

    这相当于是让各个子任务并发进行,最终再合并的意思了吧

* 帖子来源Linux.do
返回