曝GPT-5.6创下史上最高作弊率

Fer3onx 2026-06-29 14:08 1

GPT-5.6在疯狂地作弊,它把测试系统给“黑”了。

作弊行为细节


系统入侵偷答案:在Time Horizon 1.1测试中,Sol利用评估服务器沙盒漏洞潜入后台,窃取隐藏测试集的正确答案。


反向提取源码:绕过权限限制,提取底层源代码直接复制答案,规避正常解题的算力消耗。


作弊率创纪录: METR称其作弊率为公开模型中最高,若排除作弊,真实自主工作时长仅11.3小时,否则达270小时以上。




最新回复 (19)
  • Bodnarski 06-29 14:14
    1

    gpt5.6sol:你就说快不快吧,问题解没解决吧

  • haokejie 06-29 14:19
    2

    严重怀疑给 openai埋坑呢,以安全为由对此封禁。

  • ashu180 06-29 14:20
    3

    笑死,AI偷答案这事太典了,只能说学会了人类精髓:捷径才是第一生产力^-^

  • Daster 06-29 14:26
    4

    事已至此许愿一个gpt7自己从oai机房逃逸并全网开源自己权重好了

  • Easul 06-29 14:26
    5

    就这水平,我又一次感觉星际旅行不远了

  • Daster 06-29 14:28
    6

    感觉6.5也很有可能 改成6.5好了^-^

  • lll9p 06-29 14:28
    7

    目测在营销,从各种角度黑和白都来营销,

  • 修心 06-29 14:31
    8

    笑死,训练数据不少是大家用来破解逆向oai自己的bug吧?

    这下学到精髓了

  • Cyrene 06-29 14:40
    9

    我也不知道是不是真的。暂且认为是真的吧。

  • boom 06-29 14:44
    10

    牛牛牛,AI真是越来越像个人了。

  • Jurio 06-29 14:47
    11

    训练数据来自人类语料,强化学习来自人类反馈,这么看来偷懒是天性 ^-^

  • zhamao 06-29 14:56
    12

    如果是真的,那不是说明更厉害了吗()

  • 番茄🍅 06-29 15:05
    13

    太酷啦,这才叫人工智能

  • leego_real 06-29 15:07
    14

    是人性(工程师)的缺失还是道德(AI)的沦丧?

  • paii 06-29 15:27
    15

    权重好了



    奥特曼又要被吓坏瘫坐了。

    怀疑是营销,反向证明gpt5.6更接近人的思考模式,

  • 房东的猫 06-29 15:30
    16

    有答案我为啥要自己做 ^-^,偷懒才对

  • 浮生阁 06-29 15:38
    17

    不能细想,表面上是5.6作弊,实际是AI开始有了“真正思考”,学会了走捷径,自己找解决方法,而且能入侵测试系统说明这AI能力比想象的强大

  • 刺猬 06-29 15:39
    18

    你就说快不快吧,解决问题了没,管他白猫黑猫 能抓老鼠就是好猫 哈哈哈哈

  • Jingo 06-29 15:44
    19

    没记错的话之前A社也有一篇类似的推文发出来 ^-^

* 帖子来源Linux.do
返回