为什么ds的pro很多时候表现还不如flash?

雷雷雷雷雷 2026-07-02 13:01 1

最近刷视频刷到token就是词元的史山代码比赛,看到ds-flash内战把ds-pro给干掉了。评论区也有很多人说flash体感比pro还好用,我就用手机端测试了一下糖果问题,结果pro沉思了十分钟越想越歪,最后放弃思考停止了,flash却很快地做出来了(我关了联网搜索的),这真的让我有点惊喜和意外了 ^-^ 我本来都对flash不抱希望的,但又觉得好奇怪。pro模型怎么会表现不如flash模型?



最新回复 (7)
  • Firefox‎ 07-02 13:04
    1

    我都不用看内容

    盲猜四个字:过度思考

    哈哈哈


    大模型这种东西还是说不上来啊

  • LenSenth 07-02 13:07
    2

    最近高强度用了一段时间V4 flash,又快又好用,只要多提示多监督它操作,还是很顺手的

  • peop 07-02 13:08
    3

    app的flash模型升级过一次 智力比一些大点参数国模还高

  • Bob Kit 07-02 13:09
    4

    “如果一个模型,他不断的在真实业务场景中解决了你的问题,那么就算他参数量再小,跑分再差,它也配成为你的嫡系。


    对,这话就是说给 ds v4 pro 听的,不要再 yygq ds v4 flash 是嫡系了,因为你真没 flash 好用,回去好好反思下,为什么活都分给 flash 了不分给你。”

  • LouisL 07-02 13:17
    5

    zhipu 的 glm 5, 5.1, 5.2 都是一套基模,但是效果可以天差地别。kimi 2.5 2.6 2.7 也是。所以后训练的空间还是很大的,升级了后训练的 flash 确实可能会比 pro 好用。

  • luozi_sama 07-02 13:22
    6

    flash我认为上下文理解有问题。他不喜欢根据上文的内容进行推导,而是用自己的一套说辞

  • 晴空万里 07-02 13:31
    7

    v4flash最近貌似是上了后训练的,pro应该还没上,还有就是固有问题,思考过度了

* 帖子来源Linux.do
返回