GLM 额度的消耗是否会随上下文长度几何系数增加

nanbloom001 2026-07-04 18:28 1

佬友们 我是 GLM pro 会员,在 zcode 中使用,感觉额度消耗计算是不是有问题:

一开始问了几轮,额度只掉了一点点(5h 掉了 4%),跨度大约 1h 所以应该可以部分排除额度消耗统计有延迟的问题(但是延迟确实挺大),此时上下文一直控制在 4W 左右(可能是任务初期使用子代理比较多,且仓库中文件不多)此时额度感觉很耐用,但是最后一轮时,上下文来到了 20W 左右,然后额度一下子掉了 70%

感觉这个计算是不是有点问题,或者说是不是延迟有点太大了(以上均在下午高峰期)。



看 codex 的 gpt 额度都是实时变化的 就很直观

最新回复 (15)
  • X-Clone 07-04 18:32
    1

    没遇到这种情况,这消耗没谁了,搞不懂

  • 钟阮 07-04 18:34
    2

    ,上下文来到了 20W 左右,然后额度一下子掉了 70% 感觉这个计算是不是有点问题,或者说是不是延迟有点太大了(以上均在下午高峰期)。



    智谱套餐其实是token计算,输入+输出+缓存创建+缓存读取,然后一旦200K以上,那就是GLM5.1的消耗翻倍了,再叠加3x,不过脑子来计算,就可以理解为200K以上的高峰期相当于5.1是6x计费


    Pro新版本周限制是3亿,

  • nanbloom001 楼主 07-04 18:37
    3

    就是说缓存与输出同等计算,那 zcode 中的缓存率岂不是没有什么意义,至少对于自家订阅用户没有意义

  • 钟阮 07-04 18:38
    4

    对自家订阅用户没啥意义的,主要是对api、第三方供应商友好,不过也许愿智谱下版本等华为950出来以后,能给套餐加点额度吧……

  • nanbloom001 楼主 07-04 18:42
    5

    但是我感觉,第三方没有必要使用 zcode 这个应用,它对比 claude 没有什么优势,现在唯一的优势是配置远程 ssh 比较方便。还有就是感觉 GLM pro 还不如 GPT plus 耐用

  • 钟阮 07-04 18:43
    6

    我觉得Pro比Plus耐用,可能我的任务都是低峰期跑的原因,Plus我开个goal[基本就是小任务有的时候也开],5小时就没了,好像一周就3个5小时……

  • 钟阮 07-04 18:44
    7

    我自己对5.2会限制上下文到400K,不太会给她安排太多超200K的任务,那些基本会切割,我主要是图一个200K内召回

  • nanbloom001 楼主 07-04 18:47
    8

    哦哦 我是做一些知识库整理的任务,可能缓存率比较高

  • nanbloom001 楼主 07-04 18:48
    9

    但是比较好玩的是,我感觉 pro 的5h 额度可能跑不满它的一个 1M窗口 ^-^

  • 非凡 07-04 18:48
    10

    会,可以用compact做会话压缩,我有几次没注意就5小时用量很快100%了

  • nanbloom001 楼主 07-04 18:50
    11

    嗯嗯 好的佬 但是一个 20M 的对话 压缩完就剩 8K 了 感觉这个压缩率比 codex 高得多

  • 钟阮 07-04 18:51
    12

    5小时好像是6000W,应该能跑6次不到1M,低峰期

  • nanbloom001 楼主 07-04 18:51
    13

    说实话我还没有手动压缩过,因为 pro 5h 额度好像不够跑完一个对话窗口 ^-^

  • MerlinT 07-04 22:14
    14

    我也觉得在上下文较长时,消耗速度会极大增加,我一样是pro,但是我用glm5.2时就感觉额度流水一般,用一小会20%周限就没了。

  • robin_bie 07-04 22:55
    15
    "CLAUDE_CODE_AUTO_COMPACT_WINDOW": "5000000"

    比较好用, 太长了 我发现TOKEN 消耗增加了,效果并没有感觉变好


    顺便吐槽 claude 4.8 是真垃圾,经常跑着跑着 session 对话好像就串了 ,开始胡说八道

* 帖子来源Linux.do
返回