Claude Sonnet 5测评:已被GLM斩杀

HCPTangHY 2026-07-01 10:12 1



GLM5.2在更上面,太远了就截这一点

能看的案例






问题和4.7/4.8/fable一样,依旧狗屎分词器

第一次看到64k思考不完的克


依旧错字大模型




如果不算错字扣的分,大概能混了glm同等地位?

但是你降价了还比glm贵,已经被开源战车碾碎


哦,还有更敏感的赛博安全



最新回复 (17)
  • 好好好 07-01 10:16
    1

    真不错,接着斩杀,下一个就是opus

  • shyrock 07-01 10:18
    2

    在更上面?那不是已经斩杀了opus4.8了吗,你只说斩杀sonnet5是啥意思? ^-^

  • Jplinx 07-01 10:19
    3

    已经斩过了,GLM天天斩杀opus 4.8 ^-^

  • 吴亦Fan? 07-01 10:20
    4

    为什么A++急了大规模封号 加各种小动作,明显开源的GLM赶上来了。

    照这样下去,年底opus4.8一样被GLM开源咯, 后面就是拼算力了。

  • RuiQian Qin 07-01 10:21
    5

    实测GLM5.2 火山Coding Plan 不如GPT一根,国产模型依然路边一条,Claude降智 ,没办法确实拉

  • kimi 07-01 10:22
    6

    原来不是全图

    帖主你贴图贴全页吧

  • F.P SHEN 07-01 10:23
    7

    说实话,个人日常使用,非编程人员,其实不管DS 还是GLM 还是GPT以及 CLAUDE,感觉都不是很好用,有时候又感觉很强,不知道是不是一直用的中转的原因,现在基本处于薛定谔的好用 ^-^

  • kimi 07-01 10:24
    8

    具体是怎样不好用呢?

    各模型有擅长的地方

    可能使用方式的原因

  • yuexin1 07-01 10:26
    9

    本来现在sonnct就很不行了,因为我试了4.6,pro的五小时额度大概18刀左右就没了,但是使用fable5最高五小时额度可以用到54刀 用opus4.8最高可以用到42刀(虽然我也不知道咋做到的,但是那次就是多用了很多感觉),平均4.8用到25是不成问题的,从倍率上看 opus消耗是2倍,但是用的量却又变多了,甚至解决问题的能力更强了。你这个sonnct5,比不上opus4.8,即使是价格低感觉也没啥用

  • 老三 07-01 10:26
    10

    火山 coding plan 会偷偷路由的,有的时候还会路由到 GPT

    不过 GLM 和 GPT 差距还是很大,追个 claude 还是有角度的

  • chencxz 07-01 10:28
    11

    火山Coding Plan



    火山Coding Plan是量化降智版,降得非常多

  • sinaparker 07-01 10:29
    12

    不信Y,不传Y,闷声干大事就行了,毕竟40年赶超百年没点东西怎么行 ^-^

  • F.P SHEN 07-01 10:30
    13

    我是做电商的,偏工业类型的,然后在自己的NAS上面跑DOCKER上面跑的Hermes,一个数据整理的问题,一个生成主图详情页的问题,都根据自己的实际情况做了定制的SKILL,但是跑的怎么说呢,一言难尽,有时候跑的非常nice,有时候跑的依托答辩 ^-^

    但是让他多重跑几次,又好像可以了。。。。。

  • SIMONK 07-01 10:32
    14

    不能说国产模型依然路边一条,你用火山测的应该是量化的

  • 好的我知道了 07-01 10:32
    15

    感觉还是看具体场景吧,日常用其实都差不太多

  • 芙蓉蛋饼 07-01 10:32
    16

    跟提示词也有关系吧

    我也是这个体验,同一个模型的输出时而AI味很重,时而会突然降临随机数之神的眷顾抽出来一个很好的 ^-^

  • NixCore 07-01 10:53
    17

    GLM太难抢了,想体验下,还没有抢到

* 帖子来源Linux.do
返回