【搞七捻三】我 Chovy，你倒是给我拿真的 GLM-5.2 啊

galaxy 2026-07-01 21:47 1

因为最近的工作涉及一些前端，看论坛帖子国模GLM-5.2在前端上表现不错，也找了Coding Plan拼车来体验一下国产模型。

某天闲来无事刷帖子发现了一个智谱GLM Coding Plan的拼车，虽然额度不高但是价格不贵。本着玩玩glm-5.2，所以周限额，请求次数等细节问题也没有商量就已经确认上车和付钱，使用一周后发现了可能与宣传不完全一致，因为部分请求实际打到了kimi-k2.7-code，但是过了高峰时间请求，模型又回到了glm-5.2。

本帖正文纯手敲，不涉及挂人等，不会透漏原帖地址，不透露baseurl

只是记录自己的发现过程，目前来看车主应该是拿kimi-k2.7 做fallback

时间线

上周二

GLM Coding Max 车主发的是10人车，每个月50元。通过sub2api交付，提供glm-5.2模型，然后和我们讲把GLM-5.2 映射成了 gpt-5.5，所以我在后续实际请求时用的是model=gpt-5.5，后文称该渠道为渠道1。后续确认额度是【每周 160 刀，平均 0.3 刀一个请求，一周 530 次请求，不支持区分高峰和非高峰】

然后同时间我又找到一个另一个拼车，大概是5人车，然后每人一把官key，后文称为渠道0。额度大概是每周1.5亿token。（以后台显示为准，不清楚在GLM的后台高峰显示的token使用量是不是乘以三）

上周四

两天之后，为了记录我的使用量（渠道0周限额爆了），我将这两个渠道接入到我的newapi中使用，然后借助newapi的数据库记录并在本地生成一个简短报告，意图对我的请求进行记录，避免额度爆了影响到其他人，但是意外发现两个渠道之间结果有一定差异，包含回复速度，cache率和回复风格，只是有点疑惑，没有更多想法。

本周三

因为已经提交了，所以从上周四到本周二没有使用glm。在今天登录让其为我写一个中文文档时，然后请求出错如下所示，然后我第一想法是车主拿Kimi掺水了，实际之前所有的请求都是Kimi，这也印证了之前我的疑惑

然后同时间段我在车主提供的sub2api的 BaseUrl、同一个 API key、同一个请求模型 gpt-5.5 下测试 /v1/chat/completions，多次返回的实际模型都是 kimi-k2.7-code。另外，故意构造错误请求参数时，错误信息显示上游 provider 是 Moonshot。测试到这，我自己内心笃定车主掺水了。

吃过午饭，准备发个帖子吧。敲字期间又测试了一遍，发现现在又神奇的回到了glm-5.2，这期间我没有和车主交流，也没有私聊他掺水或者怎么样。后文提供了测试的方式和结果

测试方式

项目	值
鉴权	`Authorization: Bearer sk-...`
模型	`gpt-5.5`
接口	`/v1/chat/completions`、`/v1/responses`、`/v1/models`
内容	`Reply with exactly OK.`

结果一：非流式/流式 Completions 返回 kimi-k2.7-code

请求内容统一为：

{

  "model": "gpt-5.5",

  "messages": [

    {"role": "user", "content": "Reply with exactly OK."}

  ],

  "max_tokens": 64

}

然后测试结果见图片，8/64结果一样

结果就是非流式和流式都显示实际响应模型是 kimi-k2.7-code。

结果二：参数错误显示上游 provider 是 Moonshot AI

继续请求 gpt-5.5（实际请求glm-5.2），但这次故意把 temperature 写错：

{

  "model": "gpt-5.5",

  "messages": [

    {"role": "user", "content": "Reply with exactly OK."}

  ],

  "max_tokens": 8,

  "temperature": "bad-type"

}

响应为：

{

  "error": {

    "message": "Error from provider (Moonshot AI): Invalid request: the `temperature` field in the request (expected type float) is illegal, and string is not acceptable",

    "type": "invalid_request_error"

  }

}

线索三：开始反转了

正在撰写帖子，然后继续测试了几轮，然后发现结论反转了，继续借助AI总结

到这我已经确认，车主也不是掺水，毕竟掺水为什么不使用gpt-5.5？毕竟gpt可能更便宜

我的猜想是上午请求那会估计是到五小时的窗口了，然后fallback到kimi了。好处是可以体验到更多国产模型了，可能比 opencode go 额度要高一些。

问题来了：

多个模型混用这种形式会影响代码和文档质量吗？

这个车位还算是高质量车位吗？

额度分配是否合理？

最新回复 (11)

TechnologyStar 07-01 22:05

1楼

几个同学拼了max车，用不完真的用不完，希望再加几人拼车
[image]
----0624更新
目前车上已有7人，还有3位
上车的佬已经接入中转站开蹬了
额度分配如下：
参考GLM套餐用量，
总量：1600prompts/5h，8000prompts/week
人均：160prompts/5h, 800prompts/week
走中转站gpt模型计费规则（模型映射），最终策略如…

@neo

@koenigsegg
TechnologyStar 07-01 22:07

2楼

1.智谱在下午高峰期是3倍计费，会产生计费问题

2.智谱下午卡的要死，你输出如果很快肯定有问题

3.如果卖家没告诉你是属于欺诈行为可以申请退款

4.kimi和glm肯定不是一个级别的，哪个成本高、效果好大家肯定都清楚
surf 07-01 22:07

3楼

这种拼车的车主在L站的等级才1级,佬友胆子是真大 ^-^
galaxy 楼主 07-01 22:11

4楼

谢谢解答，不过这个不算我在帖子中挂人吧。应该只是达到了五小时限额，所以fallback了。另外请问佬，高峰期中 GLM后台的计费token是*3之后的，还是依然会统计原本的请求token数量呢？
后皇嘉树 07-01 22:13

5楼

智谱并发很低的，我 Pro 订阅一分钟发两次都经常撞429，Max 估计也好不到哪里去
TechnologyStar 07-01 22:17

6楼

官方后台计费×3

具体你去查一下智谱他们文档

但你拼车的sub2api没有这个影响…
TechnologyStar 07-01 22:20

7楼

下午2点-6点
galaxy 楼主 07-01 22:23

8楼

^-^只能往好了想，没有什么损失，顺便体验一把更多的模型，可能车主也是好心
傻鸟 07-01 22:24

9楼

非官方啊，那被套路就肥肠正常了，投诉让他退款吧。
galaxy 楼主 07-01 22:26

10楼

是的，这个并发数很迷，大概是根据目前正在请求的人数区分的，没有一个固定数额
enget 07-01 22:28

11楼

glm max的额度我一个人就能用完，怎么10人拼车的 ^-^

* 帖子来源Linux.do

附近帖子

↑我写了个能自己生成视频的AI工具，一句话出片，还免费用GLM-5.2
↑分享一个我日常开发的CodeX 多子代理subagents的配置文档，欢迎讨论
↑向佬们求救：梯子可以正常浏览墙外网页但是codex显示连接失败应该怎么解决呢？
↑有用RD-Agent做因子策略挖掘的佬吗
↑Gpt被封号求助
📍 【搞七捻三】我 Chovy，你倒是给我拿真的 GLM-5.2 啊
↓我去，终于把项目还原回来了
↓有佬是用一卡多开team的吗？
↓好想看小说，大家有什么小说推荐吗？
↓买了一本书来读
↓电脑好像烧起来了

飞读

galaxy

主题数
1

帖子数
1

注册排名
3

随机推荐