4 名大学生出题让 AI 考 0 分,复旦期末考改人考 AI

Pebble 2026-07-05 17:03 1

复旦大学“数据挖掘技术”课改为期末“人考 AI”:51 名学生各出 10 道有唯一答案的计算题考三个 AI 模型,AI 答错越多得分越高。结果 50 人至少难倒过某个模型一次,仅 4 人能让任一模型整张试卷得 0 分,最强模型 Claude 未被完全考倒,全班平均分 85.7 分。


授课教师肖仰华表示,传统考算法和记忆的方式在 AI 时代已失效,未来考核将重点转向评价能力、判断能力和创造性思维,课堂也从训练学生“怎么做”转向训练他们“怎么指挥 AI、怎么评判 AI 的结果”。


新华社

最新回复 (9)
  • 点点点…点娘! 07-05 17:12
    1

  • 夕Azir 07-05 17:13
    2

    用GPT-5.5-Pro做出题层,三个应考模型作答并自动判分。



    好家伙,模型对轰

  • 一摩尔氚 07-05 17:15
    3

    我感觉这个很有意思。很考察人思维能力和人对学科的理解吧。当然以及对AI 的认识

  • RainRain 07-05 17:15
    4

    我想看看是什么题,为什么不能贴出来呢?

  • 莫道 07-05 17:23
    5

    有意思,有没有佬挑战一下,特定学科相关的题也很难说

  • koubibulaien 07-05 19:16
    6

    其实我很好奇考的AI是什么AI,如果是纯网页端的chat话漏洞挺多的,如果是把题放在进agent框架里,解决问题的范围就扩大很多了。


    纯chat,可以直接要求他一个一个输出1到1000000的所有阶乘结果,能直接给他上下文窗口硬生生塞爆。也符合计算题拥有唯一答案的要求。就是欺负他没手没脚,哈哈哈


    但是如果是Agent的话,他就可以直接用代码写个python输出,随随便便就解决了

  • 出離 07-05 20:14
    7

    的确,提出问题本就比回答问题更有价值

    不过我看他们说的指挥评判ai,总感觉不如直接教哲学和社会学更有价值

  • 新火新茶 07-05 20:33
    8

    OpenAI 不是在找各种科学家付费出难题吗,这期末考核结束,是不是可以把AI做错的题目出售给各大AI厂商,学生还能获得额外收入。此外还能防止下一届学生收集祖传题目,有效遏制抄袭行为。

  • lueluelue 07-05 20:41
    9

    GPT 5.5 Pro:听说有本科生要挑战我

* 帖子来源Linux.do
返回