40855 ? codex 问不出正常的 juice number 了吗

Hao 2026-06-28 01:34 1

刚刚发现 Codex 给我解除了降智,用之前的降智测试脚本测了一下发现确实不降智了,但是 reasoning tokens 比以前短了很多:



5.5 xhigh 回答糖果问题 reasoning tokens 只有 1k+,以前测试有 4k 左右




我猜测有可能是 OpenAI 偷偷替换了模型或者调整了我的 juice number,于是我打开 Codex 尝试询问 juice number,发现根本问不出以前的正常值了,现在问出来是 40855




以前大家测出来的 gpt-5.5 的 juice number 通常如下:



  • low 12

  • medium 24

  • high 96

  • xhigh 768


所以发生了什么?juice number 怎么变了?

最新回复 (14)
  • 小米 06-28 01:38
    1

    有没有可能是 这个时间段 用的人少了 算力分配回来了

  • Hao 楼主 06-28 01:39
    2

    这跟 juice number 有什么关系?以前 juice number 不是反映推理等级吗?现在怎么看起来像是一个随机数。


    另外似乎并不是所有号都是随机数,我有另一个号,问出来的仍然是 768.

  • 06-28 01:40
    3

    个人认为40855等异常的数字输出就是模型流口水了,连自身思考等级都找不出来



    附一张刚测的图

  • Nasavoyager 06-28 01:40
    4

    你不用想了 100% 就是降智或者路由到的量化模型

  • VictorQuqi 06-28 01:42
    5

    其实是给你灰度到了 GPT-6.0,这个 juice number 是真实的(

  • Hao 楼主 06-28 01:43
    6

    给你灰度到了 GPT-6.0



    包不可能的,其实不一定是这个值,更像是随机数,甚至还有小数,更像是截断思考以外的另一种降智手段。

  • Hao 楼主 06-28 01:44
    7

    个人认为40855等异常的数字输出就是模型流口水了



    极有可能,因为推理长度明显没有达到 xhigh 的水平。

  • Hao 楼主 06-28 01:46
    8

    但是最近最流行的降智手段是 reasoning tokens 被截断到 516 导致糖果问题无法正确回答,我这个情况居然还能正确回答,就是 low 和 xhigh 的 reasoning tokens 长度差不多……

  • Hao 楼主 06-28 01:48
    9

    降智手段真的太多了,也太脏了,防不胜防

  • supermadmax 06-28 01:50
    10

    气死了 ^-^ OpenAI 的随机降智



  • Hao 楼主 06-28 01:51
    11

    你这个正确回答的时候推理深度才是正常的,我那个推理深度完全不正常了。 ^-^

  • Kiloy 06-29 20:37
    12

    我也这么认为,切了个IP之后,发现回答问题给的方案蠢的流口水,然后想着问一下juice number看看,结果就是40855,之前都是固定768。

  • RES5181 06-30 01:21
    13

    佬,我发现我们出现的症状很相似,我在发现你的降智测试脚本之前就发现我的codex juice值不正常。当时是64855和64805。今天再测发现我的juice值虽然仍然不正常,但是变成了128805,在确保糖果测试全对的情况下:



    我重开一个session再测试了一次juice,这次它提供了128的正常值。随后我又刷到这位佬的帖子: codex 内 灰度到 5.6 的 窗口变成 353k了 - 前沿快讯 - LINUX DO

  • RES5181 06-30 01:23
    14

    他的帖子里称,40855是没有小数点的gpt5.6的juice值,佬可以看一下上下文窗口是否扩大到353k,说不定是被灰度到5.6了。也可以多开两个session测试一下juice,看是否会有正常值出现。

* 帖子来源Linux.do
返回