话说哪位大佬能科普一下为什么DeepSeekV4的DSpark虽然提升了推理速度,但是其实降智还挺明显的

vibe狂徒张三 2026-06-28 07:22 1

这两天 DeepSeek 公众号发的那篇 DSpark 的文章,我看很多自媒体都在解读,但都避重就轻的在聊技术创新, DeepSeek 的技术创新是国产之光,这个是毋庸置疑的。


但从大家使用的体感来看,DeepSeek 这一次针对 V4 的升级好像导致了模型降智。这是为什么?有哪位大佬可以来科普一下?

最新回复 (2)
  • 退堂鼓演奏家 06-28 08:15
    1

    降智不说 让它严格按json输出都不行 循环十次 总有几次给你少个冒号或者引号

  • Uncle Bear 06-28 08:21
    2

    这个不只是 DeepSeek 的问题,是所有 LLM 都会有的问题。


    最近在做 Agent Harness 开发,有个差点逼疯我的问题就是 json 格式不稳定、schema 命名不稳定。换个 LLM 也并没有缓解。


    这个都不是幻觉问题。还是因为生成权重的问题。

* 帖子来源Linux.do
返回