如何通过开源文件判断发布的LLM模型架构?

botbot 2026-07-01 14:58 1

如题,最近盘古发布了一个新模型2.0-flash,想起之前“盘古之殇”中“盘古LLM被人扒出套壳qwen”主要在于文件中没有修改"qwen"字段,且和qwen团队方法相似。

于是有好奇:对于公开出的模型权重和配置文件,如何判断其架构上和其他LLM的不同,以及分析其优化改进的策略,从而避免官方文档虚假宣传误导呢? ^-^

最新回复 (1)
  • Firefox‎ 07-01 15:33
    1

    对于我这种不懂的人


    只用会的人来扒就好了 ^-^

* 帖子来源Linux.do
返回