4 名大学生出题让 AI 考 0 分，复旦期末考改人考 AI

Pebble 2026-07-05 17:03 1

复旦大学“数据挖掘技术”课改为期末“人考 AI”：51 名学生各出 10 道有唯一答案的计算题考三个 AI 模型，AI 答错越多得分越高。结果 50 人至少难倒过某个模型一次，仅 4 人能让任一模型整张试卷得 0 分，最强模型 Claude 未被完全考倒，全班平均分 85.7 分。

授课教师肖仰华表示，传统考算法和记忆的方式在 AI 时代已失效，未来考核将重点转向评价能力、判断能力和创造性思维，课堂也从训练学生“怎么做”转向训练他们“怎么指挥 AI、怎么评判 AI 的结果”。

新华社

最新回复 (9)

点点点…点娘！ 07-05 17:12

1楼
夕Azir 07-05 17:13

2楼

用GPT-5.5-Pro做出题层，三个应考模型作答并自动判分。

好家伙，模型对轰
一摩尔氚 07-05 17:15

3楼

我感觉这个很有意思。很考察人思维能力和人对学科的理解吧。当然以及对AI 的认识
RainRain 07-05 17:15

4楼

我想看看是什么题，为什么不能贴出来呢？
莫道 07-05 17:23

5楼

有意思，有没有佬挑战一下，特定学科相关的题也很难说
koubibulaien 07-05 19:16

6楼

其实我很好奇考的AI是什么AI，如果是纯网页端的chat话漏洞挺多的，如果是把题放在进agent框架里，解决问题的范围就扩大很多了。

纯chat，可以直接要求他一个一个输出1到1000000的所有阶乘结果，能直接给他上下文窗口硬生生塞爆。也符合计算题拥有唯一答案的要求。就是欺负他没手没脚，哈哈哈

但是如果是Agent的话，他就可以直接用代码写个python输出，随随便便就解决了
出離 07-05 20:14

7楼

的确，提出问题本就比回答问题更有价值

不过我看他们说的指挥评判ai，总感觉不如直接教哲学和社会学更有价值
新火新茶 07-05 20:33

8楼

OpenAI 不是在找各种科学家付费出难题吗，这期末考核结束，是不是可以把AI做错的题目出售给各大AI厂商，学生还能获得额外收入。此外还能防止下一届学生收集祖传题目，有效遏制抄袭行为。
lueluelue 07-05 20:41

9楼

GPT 5.5 Pro：听说有本科生要挑战我

* 帖子来源Linux.do

附近帖子

飞读

Pebble

主题数
1

帖子数
1

注册排名
3

随机推荐