曝GPT-5.6创下史上最高作弊率

Fer3onx 2026-06-29 14:08 1

GPT-5.6在疯狂地作弊，它把测试系统给“黑”了。

作弊行为细节

系统入侵偷答案:在Time Horizon 1.1测试中，Sol利用评估服务器沙盒漏洞潜入后台，窃取隐藏测试集的正确答案。

反向提取源码:绕过权限限制，提取底层源代码直接复制答案，规避正常解题的算力消耗。

作弊率创纪录: METR称其作弊率为公开模型中最高，若排除作弊，真实自主工作时长仅11.3小时，否则达270小时以上。

最新回复 (19)

Bodnarski 06-29 14:14

1楼

gpt5.6sol:你就说快不快吧，问题解没解决吧
haokejie 06-29 14:19

2楼

严重怀疑给 openai埋坑呢，以安全为由对此封禁。
ashu180 06-29 14:20

3楼

笑死，AI偷答案这事太典了，只能说学会了人类精髓：捷径才是第一生产力^-^
Daster 06-29 14:26

4楼

事已至此许愿一个gpt7自己从oai机房逃逸并全网开源自己权重好了
Easul 06-29 14:26

5楼

就这水平，我又一次感觉星际旅行不远了
Daster 06-29 14:28

6楼

感觉6.5也很有可能改成6.5好了^-^
lll9p 06-29 14:28

7楼

目测在营销，从各种角度黑和白都来营销，
修心 06-29 14:31

8楼

笑死，训练数据不少是大家用来破解逆向oai自己的bug吧？

这下学到精髓了
Cyrene 06-29 14:40

9楼

我也不知道是不是真的。暂且认为是真的吧。
boom 06-29 14:44

10楼

牛牛牛，AI真是越来越像个人了。
Jurio 06-29 14:47

11楼

训练数据来自人类语料，强化学习来自人类反馈，这么看来偷懒是天性 ^-^
zhamao 06-29 14:56

12楼

如果是真的,那不是说明更厉害了吗()
番茄🍅 06-29 15:05

13楼

太酷啦，这才叫人工智能
leego_real 06-29 15:07

14楼

是人性（工程师）的缺失还是道德（AI）的沦丧？
paii 06-29 15:27

15楼

权重好了

奥特曼又要被吓坏瘫坐了。

怀疑是营销，反向证明gpt5.6更接近人的思考模式，
房东的猫 06-29 15:30

16楼

有答案我为啥要自己做 ^-^，偷懒才对
浮生阁 06-29 15:38

17楼

不能细想，表面上是5.6作弊，实际是AI开始有了“真正思考”，学会了走捷径，自己找解决方法，而且能入侵测试系统说明这AI能力比想象的强大
刺猬 06-29 15:39

18楼

你就说快不快吧，解决问题了没，管他白猫黑猫能抓老鼠就是好猫哈哈哈哈
Jingo 06-29 15:44

19楼

没记错的话之前A社也有一篇类似的推文发出来 ^-^