首先声明,我不是任何车企,或者说任何品牌的粉丝,我(可能不那么平等地)在不同方面鄙视特斯拉、比亚迪、鸿蒙智行、小米、理想等企业,天下乌鸦一般黑,家用汽车市场巨大的利益面前,从来没有什么出淤泥而不染的白莲花。
但是我认为就事论事是一切讨论的基础,脱离事实攻击立场或者从立场得出结论,其讨论必然偏离真相。
譬如有人以抖音平台的AIGC标记,试图实锤问界宣传素材确系AI生成,这无疑十分可笑,而且大概率是利用间接结论反推原理的本末倒置。

所以容我再次叠甲:我不对问界的宣传视频是否用了AI做出评判,此帖仅仅旨在解释所谓的AI检测的原理,以及平台在合规与风控方面的真实考量。
从技术角度来说,AI检测主要依赖两种途径:
第一种是隐写水印,就是模型产出结果后,外部工具对结果(通常是图片/视频)进行隐写水印,标记该图片由某个AI生成,AI检测工具可以通过识别该隐写水印识别AI生成的图片,典型例子如谷歌的SynthID。其优点是识别相当准确,分离度极佳;缺点是并不识别模型的固有特征,依赖外部工具,假如华为使用自己的AI(或者有利益往来的AI)创建媒体,大概率不会去隐写水印当自爆卡车,这种AI检测方式自然也就歇逼了。
第二种是隐藏特征提取,某个特定的模型,因为其特定的神经网络架构和训练集,产出结果可能在高维空间存在部分可识别的特征(指纹)。通过逆向分析产出结果,提取特征,可以尝试识别AI产出内容。其优点是绑定神经网络模型固有特征,难以伪造和掩盖;缺点就是维护成本极高、泛用性极差,不同架构、不同训练集的模型,其高维隐藏特征可能完全不同,一套算法可能只能适用于某一公司的某一特定架构、甚至某一特定版本模型,更不必说目前流行的GAN和Diffusion训练的本质就是“造假者”和“测谎仪”的对抗进化。这意味着,如果华为使用了内部未公开或者未被逆向提取特征的视频生成AI,那么也不存在第三方工具能够通过固有特征予以识别。
也就是说,不存在一种通用算法,能够区分过去、现在、未来的所有AI,无论是图片、视频、语言或者其他任何可能的功能模型生成的内容与人类创建的真实内容(反证法,如果存在这种算法,那么就可以针对此检测算法做对抗训练,把检测率纳入损失函数)。而抖音、B站等平台对于“AI生成内容”的自动识别算法,目前来说极大依靠前一种,也就是隐写水印的识别,模型特征识别基本处于两眼一抹黑的境地,上传者自行标注、其他用户大量举报才占更大的权重。但作为视频平台,抖音肯定不可能对外说因为用户举报多了所以我们把它标注成AI,只能说《运用技术手段检测AI特征》,算是相当“体面”的说辞,至于真相如何,无人在意也无需在意。
其实这话也就骗骗傻子,若是把隐写水印去掉,他们连Google Veo3都不见得能识别出来。
LLM生成的文本内容,由于无法在后期添加“不可察觉的水印”,因此各路AIGC检测工具只能硬着头皮提取文本的特征指纹,而它们的垃圾准确率是有目共睹的。腾讯的朱雀AIGC检测工具,身为“行业标杆”,甚至“先进”到只要将标点符号改为英文字符,就能欺骗它将正常文本鉴定出AIGC。
看到这里,请为每一个正在与论文重复率和AI率吉列豆蒸的研究生默哀1秒钟。
我没有证据去证实或否认问界的宣传视频是否使用了AI造假,但是我可以肯定,抖音上对于相关视频的AI标记,极大概率来源于网络节奏起来以后的网友大量举报,而不是鸿蒙智行真的蠢到给自己所谓实拍的宣传素材加了AI生成水印标记。