对漏洞挖掘/网络安全领域，harness比模型本身更重要？

aviraxp 2026-06-30 23:02 1

看到一篇文章：https://zhuanlan.zhihu.com/p/2048403073870181206

我们首先收集了 Mythos 找到的部分漏洞，对相关代码上下文进行人工切片和拼接，在关闭联网搜索功能的前提下，分别发送给 DeepSeek 等开源模型进行分析。结果显示，在充分的上下文（Context）和合理的提示（Prompt）下，前沿开源模型已经能够识别出绝大多数 Mythos 找到的漏洞。

然而，如果把相应的代码仓库直接交给这些开源模型，在 Claude Code、OpenCode 等通用 agent 框架下自由分析，结果通常极不稳定。模型可能会在无关路径上消耗大量 Token，也可能过早收敛到错误假设，还可能给出看似合理但无法验证的结论。

考虑到实验中存在人为介入的 Context 切分和 Prompt 构建，这一结果显然不意味着开源模型能力已经追平 Mythos。但它至少说明：前沿开源模型并非不具备发现相应漏洞所需的安全知识，而是缺乏把这些知识组织成有效探索行为的外部系统。

darknavy是非常厉害的团队（拼多多漏洞就是他们首先爆出来的）。

最新回复 (1)

星空 07-01 09:11

1楼

模型能力的快速增长会让在harness上面的付出没有意义

* 帖子来源Linux.do

附近帖子

↑Anthropic偷偷在Claude Code中植入了隐形代码，只为识别中国用户
↑【开源推广】Claude Desktop Windows 中文补丁工具GUI，支持简体中文、繁体中文和一键恢复
↑心血来潮，订阅了claude
↑万能的佬友，问一个显示器支悬臂支架适配的问题！
↑lv3那2万浏览太坐牢了
📍 对漏洞挖掘/网络安全领域，harness比模型本身更重要？
↓「开源」AI全自动开发1.0正式版发布解决AI幻觉全自动产出生产级软件多AI CLI协作
↓微信更新了朋友圈展示方式，我这是被灰度了？
↓IDEA激活工具有吗？
↓某品牌汽车销售公司直播造谣、抹黑**汽车，并剪辑成短视频在多平台发布，被行政处罚40万元
↓Claude Sonnet 5上线