为什么ds的pro很多时候表现还不如flash？

雷雷雷雷雷 2026-07-02 13:01 1

最近刷视频刷到token就是词元的史山代码比赛，看到ds-flash内战把ds-pro给干掉了。评论区也有很多人说flash体感比pro还好用，我就用手机端测试了一下糖果问题，结果pro沉思了十分钟越想越歪，最后放弃思考停止了，flash却很快地做出来了（我关了联网搜索的），这真的让我有点惊喜和意外了 ^-^ 我本来都对flash不抱希望的，但又觉得好奇怪。pro模型怎么会表现不如flash模型？

最新回复 (7)

Firefox‎ 07-02 13:04

1楼

我都不用看内容

盲猜四个字：过度思考

哈哈哈

大模型这种东西还是说不上来啊
LenSenth 07-02 13:07

2楼

最近高强度用了一段时间V4 flash，又快又好用，只要多提示多监督它操作，还是很顺手的
peop 07-02 13:08

3楼

app的flash模型升级过一次智力比一些大点参数国模还高
Bob Kit 07-02 13:09

4楼

“如果一个模型，他不断的在真实业务场景中解决了你的问题，那么就算他参数量再小，跑分再差，它也配成为你的嫡系。

对，这话就是说给 ds v4 pro 听的，不要再 yygq ds v4 flash 是嫡系了，因为你真没 flash 好用，回去好好反思下，为什么活都分给 flash 了不分给你。”
LouisL 07-02 13:17

5楼

zhipu 的 glm 5, 5.1, 5.2 都是一套基模，但是效果可以天差地别。kimi 2.5 2.6 2.7 也是。所以后训练的空间还是很大的，升级了后训练的 flash 确实可能会比 pro 好用。
luozi_sama 07-02 13:22

6楼

flash我认为上下文理解有问题。他不喜欢根据上文的内容进行推导，而是用自己的一套说辞
晴空万里 07-02 13:31

7楼

v4flash最近貌似是上了后训练的，pro应该还没上，还有就是固有问题，思考过度了

* 帖子来源Linux.do

附近帖子

飞读

雷雷雷雷雷

主题数
1

帖子数
1

注册排名
3

随机推荐