Fable 5 竟然认得出来《再见绘梨》,我眩晕瘫坐在椅子上,就像亲眼看见核弹在我屏幕正中央爆炸——我连这漫画都没看过,fable却能讲出有多少页

Lziu 2026-07-02 17:28 1

今天下午想着跟fable5聊聊天,刚好毕业,给自己ps了一个再见绘梨的爆炸图片,把学校炸掉,问他对于文案的意见,没想到他居然知道是再见绘里,gpt5.5 opus4.8都不认识,我瘫坐在椅子上,就像亲眼看见在我电脑上核弹爆炸。fable5的参数究竟多少T?



最新回复 (16)
  • VincentChen 07-02 17:29
    1

    你居然拿他来做这个事,浪费啊,只有几天时间

  • Lziu 楼主 07-02 17:30
    2

    any路由器,随便用呀,今天下午挤了半小时挤进去了

  • Lziu 楼主 07-02 17:30
    3



    Gemini3.1也认识,Gemini多模态还是强悍啊 ^-^

  • NaiveMagic 07-02 17:31
    4

    gemini 的世界知识一直是遥遥领先的,其它模型根本不是一个级别的

  • zhoxi3 07-02 17:34
    5

    按理说知识丰富不应该智力超群吗哈哈

  • NaiveMagic 07-02 17:36
    6

    gemini 智力确实不差的,前提是短上下文,上下文一旦长了注意力就出问题了就很多幻觉

    所以 gemini 并不适合 coding, 适合进行短上下文的 chat

  • NaiveMagic 07-02 17:37
    7

    来自 lenz 的一项研究 Beyond Benchmarks: Frontier LLM Disagreement on Fact-Checks
    让AI进行事实核查 并判断核查结果是否正确
    官方给的各种数据乱七八糟 所以我用raw data整理了下人能看懂的数据
    简单 但易懂
    数据集中包含以下模型
    gpt-5.4_verdict
    claude-opus-4-7_verdict
    ge…
  • DEbao 07-02 17:37
    8

    有网络搜索,我觉得都应该知道呀,gpt 不知道?

  • zhoxi3 07-02 17:37
    9

    快进到3.5pro 1.5M上下文然后瘫坐

  • Lziu 楼主 07-02 17:38
    10

    在不网络搜索的情况下呀,fable也没网络搜索,就纯聊天

  • Lziu 楼主 07-02 17:39
    11

    之前Gemini2.5p时代没降智的时候酒馆和coding都算是顶尖水平吧,可惜没维持住,不然直接震惊瘫坐 ^-^

  • NaiveMagic 07-02 17:39
    12

    3.0 和 3.1 也是 1M, 不妨碍上下文长了就流口水,最大的问题是 gemini 使用的滑动注意力窗口的机制,有效上下文少的可怜,这个架构不改扩大总上下文也还是流口水

  • 42 07-02 17:41
    13

    gpt5.5 opus4.8都不认识



    我要看看opus4.6知不知道w

  • Lziu 楼主 07-02 17:47
    14

    理论上来说,opus4.6的参数量应该不如opus4.8吧的,毕竟是上两代模型。实测也是这样的结果


  • Noel2 07-02 17:54
    15

    知识很丰富,但是很懒,而且不听话

  • purr 07-02 18:15
    16

    4.6比4.8大很多

    自从4.7开始就都是算力优化了


    4.8能回答对个人感觉几种可能

    模型换了tokenizer

    模型截止日期是今年

    图片理解更好


    具体测试模型大小的项目就ikp目前还行 但是他们不更新

    最新的是4.6和4.7比较 4.7小很多

* 帖子来源Linux.do
返回