Fable 5 竟然认得出来《再见绘梨》，我眩晕瘫坐在椅子上，就像亲眼看见核弹在我屏幕正中央爆炸——我连这漫画都没看过，fable却能讲出有多少页

Lziu 2026-07-02 17:28 1

今天下午想着跟fable5聊聊天，刚好毕业，给自己ps了一个再见绘梨的爆炸图片，把学校炸掉，问他对于文案的意见，没想到他居然知道是再见绘里，gpt5.5 opus4.8都不认识，我瘫坐在椅子上，就像亲眼看见在我电脑上核弹爆炸。fable5的参数究竟多少T？

最新回复 (16)

VincentChen 07-02 17:29

1楼

你居然拿他来做这个事，浪费啊，只有几天时间
Lziu 楼主 07-02 17:30

2楼

any路由器，随便用呀，今天下午挤了半小时挤进去了
Lziu 楼主 07-02 17:30

3楼

Gemini3.1也认识，Gemini多模态还是强悍啊 ^-^
NaiveMagic 07-02 17:31

4楼

gemini 的世界知识一直是遥遥领先的，其它模型根本不是一个级别的
zhoxi3 07-02 17:34

5楼

按理说知识丰富不应该智力超群吗哈哈
NaiveMagic 07-02 17:36

6楼

gemini 智力确实不差的，前提是短上下文，上下文一旦长了注意力就出问题了就很多幻觉

所以 gemini 并不适合 coding, 适合进行短上下文的 chat
NaiveMagic 07-02 17:37

7楼

来自 lenz 的一项研究 Beyond Benchmarks: Frontier LLM Disagreement on Fact-Checks
让AI进行事实核查并判断核查结果是否正确
官方给的各种数据乱七八糟所以我用raw data整理了下人能看懂的数据
简单但易懂
数据集中包含以下模型
gpt-5.4_verdict
claude-opus-4-7_verdict
ge…
DEbao 07-02 17:37

8楼

有网络搜索，我觉得都应该知道呀，gpt 不知道？
zhoxi3 07-02 17:37

9楼

快进到3.5pro 1.5M上下文然后瘫坐
Lziu 楼主 07-02 17:38

10楼

在不网络搜索的情况下呀，fable也没网络搜索，就纯聊天
Lziu 楼主 07-02 17:39

11楼

之前Gemini2.5p时代没降智的时候酒馆和coding都算是顶尖水平吧，可惜没维持住，不然直接震惊瘫坐 ^-^
NaiveMagic 07-02 17:39

12楼

3.0 和 3.1 也是 1M, 不妨碍上下文长了就流口水，最大的问题是 gemini 使用的滑动注意力窗口的机制，有效上下文少的可怜，这个架构不改扩大总上下文也还是流口水
42 07-02 17:41

13楼

gpt5.5 opus4.8都不认识

我要看看opus4.6知不知道w
Lziu 楼主 07-02 17:47

14楼

理论上来说，opus4.6的参数量应该不如opus4.8吧的，毕竟是上两代模型。实测也是这样的结果
Noel2 07-02 17:54

15楼

知识很丰富，但是很懒，而且不听话
purr 07-02 18:15

16楼

4.6比4.8大很多

自从4.7开始就都是算力优化了

4.8能回答对个人感觉几种可能

模型换了tokenizer

模型截止日期是今年

图片理解更好

具体测试模型大小的项目就ikp目前还行但是他们不更新

最新的是4.6和4.7比较 4.7小很多

* 帖子来源Linux.do

附近帖子

↑这是什么娱乐场所？？？人还挺多
↑佬们有什么指纹浏览器推荐啊？
↑这 Fable 真是花 Token 如流水，Max 20 根本顶不住。佬友有什么奇技淫巧能够降一降？
↑Youtube 百万订阅头部创作者揭露中国的地下中转站生意
↑下午访问L站给我卡成小呆呆了
📍 Fable 5 竟然认得出来《再见绘梨》，我眩晕瘫坐在椅子上，就像亲眼看见核弹在我屏幕正中央爆炸——我连这漫画都没看过，fable却能讲出有多少页
↓这边简单命令一下，涨价前买了Mac的佬，请把你们的帖子删掉
↓GML5.2画的网页，大家看看怎么样
↓Deepseek貌似GG了，访问超时
↓办公领域什么时候才能迎来它的claude code
↓讨论一下 Wails、Tauri、Flutter、Electron 这几种热门的桌面客户端技术栈

飞读

Lziu

主题数
1

帖子数
1

注册排名
3

随机推荐