GLM 额度的消耗是否会随上下文长度几何系数增加

nanbloom001 2026-07-04 18:28 1

佬友们我是 GLM pro 会员，在 zcode 中使用，感觉额度消耗计算是不是有问题：

一开始问了几轮，额度只掉了一点点（5h 掉了 4%），跨度大约 1h 所以应该可以部分排除额度消耗统计有延迟的问题（但是延迟确实挺大），此时上下文一直控制在 4W 左右（可能是任务初期使用子代理比较多，且仓库中文件不多）此时额度感觉很耐用，但是最后一轮时，上下文来到了 20W 左右，然后额度一下子掉了 70%

感觉这个计算是不是有点问题，或者说是不是延迟有点太大了（以上均在下午高峰期）。

看 codex 的 gpt 额度都是实时变化的 就很直观

最新回复 (15)

X-Clone 07-04 18:32

1楼

没遇到这种情况，这消耗没谁了，搞不懂
钟阮 07-04 18:34

2楼

，上下文来到了 20W 左右，然后额度一下子掉了 70% 感觉这个计算是不是有点问题，或者说是不是延迟有点太大了（以上均在下午高峰期）。

智谱套餐其实是token计算，输入+输出+缓存创建+缓存读取，然后一旦200K以上，那就是GLM5.1的消耗翻倍了，再叠加3x，不过脑子来计算，就可以理解为200K以上的高峰期相当于5.1是6x计费

Pro新版本周限制是3亿，
nanbloom001 楼主 07-04 18:37

3楼

就是说缓存与输出同等计算，那 zcode 中的缓存率岂不是没有什么意义，至少对于自家订阅用户没有意义
钟阮 07-04 18:38

4楼

对自家订阅用户没啥意义的，主要是对api、第三方供应商友好，不过也许愿智谱下版本等华为950出来以后，能给套餐加点额度吧……
nanbloom001 楼主 07-04 18:42

5楼

但是我感觉，第三方没有必要使用 zcode 这个应用，它对比 claude 没有什么优势，现在唯一的优势是配置远程 ssh 比较方便。还有就是感觉 GLM pro 还不如 GPT plus 耐用
钟阮 07-04 18:43

6楼

我觉得Pro比Plus耐用，可能我的任务都是低峰期跑的原因，Plus我开个goal［基本就是小任务有的时候也开］，5小时就没了，好像一周就3个5小时……
钟阮 07-04 18:44

7楼

我自己对5.2会限制上下文到400K，不太会给她安排太多超200K的任务，那些基本会切割，我主要是图一个200K内召回
nanbloom001 楼主 07-04 18:47

8楼

哦哦我是做一些知识库整理的任务，可能缓存率比较高
nanbloom001 楼主 07-04 18:48

9楼

但是比较好玩的是，我感觉 pro 的5h 额度可能跑不满它的一个 1M窗口 ^-^
非凡 07-04 18:48

10楼

会，可以用compact做会话压缩，我有几次没注意就5小时用量很快100%了
nanbloom001 楼主 07-04 18:50

11楼

嗯嗯好的佬但是一个 20M 的对话压缩完就剩 8K 了感觉这个压缩率比 codex 高得多
钟阮 07-04 18:51

12楼

5小时好像是6000W，应该能跑6次不到1M，低峰期
nanbloom001 楼主 07-04 18:51

13楼

说实话我还没有手动压缩过，因为 pro 5h 额度好像不够跑完一个对话窗口 ^-^
MerlinT 07-04 22:14

14楼

我也觉得在上下文较长时，消耗速度会极大增加，我一样是pro，但是我用glm5.2时就感觉额度流水一般，用一小会20%周限就没了。
robin_bie 07-04 22:55

15楼
```
"CLAUDE_CODE_AUTO_COMPACT_WINDOW": "5000000"
```
比较好用，太长了我发现TOKEN 消耗增加了，效果并没有感觉变好

顺便吐槽 claude 4.8 是真垃圾，经常跑着跑着 session 对话好像就串了，开始胡说八道

* 帖子来源Linux.do

附近帖子

飞读

nanbloom001

主题数
1

帖子数
1

注册排名
3

随机推荐