如题,最近盘古发布了一个新模型2.0-flash,想起之前“盘古之殇”中“盘古LLM被人扒出套壳qwen”主要在于文件中没有修改"qwen"字段,且和qwen团队方法相似。 于是有好奇:对于公开出的模型权重和配置文件,如何判断其架构上和其他LLM的不同,以及分析其优化改进的策略,从而避免官方文档虚假宣传误导呢? ^-^
对于我这种不懂的人
只用会的人来扒就好了 ^-^