对漏洞挖掘/网络安全领域,harness比模型本身更重要?

aviraxp 2026-06-30 23:02 1

看到一篇文章:https://zhuanlan.zhihu.com/p/2048403073870181206


我们首先收集了 Mythos 找到的部分漏洞,对相关代码上下文进行人工切片和拼接,在关闭联网搜索功能的前提下,分别发送给 DeepSeek 等开源模型进行分析。结果显示,在充分的上下文(Context)和合理的提示(Prompt)下,前沿开源模型已经能够识别出绝大多数 Mythos 找到的漏洞。


然而,如果把相应的代码仓库直接交给这些开源模型,在 Claude Code、OpenCode 等通用 agent 框架下自由分析,结果通常极不稳定。模型可能会在无关路径上消耗大量 Token,也可能过早收敛到错误假设,还可能给出看似合理但无法验证的结论。


考虑到实验中存在人为介入的 Context 切分和 Prompt 构建,这一结果显然不意味着开源模型能力已经追平 Mythos。但它至少说明:前沿开源模型并非不具备发现相应漏洞所需的安全知识,而是缺乏把这些知识组织成有效探索行为的外部系统。


darknavy是非常厉害的团队(拼多多漏洞就是他们首先爆出来的)。

最新回复 (1)
  • 星空 07-01 09:11
    1

    模型能力的快速增长会让在harness上面的付出没有意义

* 帖子来源Linux.do
返回