DeepSeeK 突然发布 DSpark,让 AI 的回答不再「挤牙膏」

杰哥 2026-06-27 21:42 1

DeepSeek 联合北大发布并开源了推理加速框架 DSpark(已上线 DeepSeek-V4 预览版)。该框架能根据系统负载和文本置信度,动态调整推测解码的验证长度,在线上高并发场景下将系统吞吐提升了 50%

以上,显著提升了生成速度并降低了推理成本。项目地址:GitHub - deepseek-ai/DeepSpec: DeepSpec: a full-stack codebase for training and evaluating speculative decoding algorithms · GitHub

最新回复 (7)
  • bugfree 06-27 21:45
    1

    额,听起来不错,但是代价呢,有没有副作用

  • sis5595 06-27 22:21
    2

    DS起到的是中国AI“教父”的作用

  • Marisa 06-27 22:24
    3

    呃呃、看不大懂,大概的意思是,动态调整思考强度? ^-^ 还得需要懂的大佬来教学一下。

  • sparklydream 06-27 23:03
    4

    怎么一边说是吞吐不变的情况下每个用户的 tps 提高 65\% \sim 80\%,一边又说吞吐提升 50\%

  • 吃豆人 06-27 23:06
    5

    感觉有点像动态降智,只能说看看后续表现了

  • astrostar 06-28 02:34
    6

    MTP改进,应该是针对简单的问题让起草器更激进的预测

  • Yunfei Chen 06-28 09:49
    7

    其实就是动态降智,负载高的时候自动降智,唉!

* 帖子来源Linux.do
返回