本地部署大模型,很多自动任务和脚本客服接待

nienien 2026-06-30 13:01 1

没有强烈的代码需求,你们觉得跑什么样的模型好呀?硬件上搞一个4090或3090是不是就够了,

最新回复 (7)
  • cnnlei 06-30 13:04
    1

    qwen 27b

  • Emmmc 06-30 13:06
    2

    @nienien #0


    直接用API,4090和3090内存不够。简单的模型太弱智,复杂的模型上下文长度一大,你就爆显存了。

  • nienien 楼主 06-30 13:07
    3

    @Emmmc #2


    目前也就是这样了.本地模型部署硬件太夸张了。。

  • 宗山 06-30 13:07
    4

    API

  • akanotanin 06-30 13:08
    5

    部署Qwen3.6-35B-A3B-Q4_K_M吧,4090/3090刚好

  • nienien 楼主 06-30 13:09
    6

    @akanotanin #5 上下文会炸。显存扛不住。特别是接入项目后想连续流畅的上下文起码pro 6000起才能丝滑体验。

  • 独孤伽罗 06-30 13:11
    7

    直接脚本接入API,然后把提问和大模型的回复写入资料库。资料库充实后再换本地模型试试。

* 帖子来源NodeSeek
返回