AI 到底有没有看懂你的提示词?

luckybilly 2026-06-30 13:50 1

你有没有过这种经历?


想用 AI 做点什么(比如写代码),认真地梳理完思路、写完一段提示词,发送之后只能干等。少则几十秒,多则几分钟。你不知道 AI 怎么拆解你的需求,不知道它悄悄脑补了什么前提、曲解了哪些约束。只能等它全部输出完,回头一看:坏了,跑偏了。


前面等的那些时间全部白费。你要么清空上下文从头来,要么在多轮对话里一点点掰正它,每轮对话都是分钟级的等待。大量时间耗在纠错上,而不是做正事。思路也被打乱了,心态也崩了。


吃过亏之后,你开始事无巨细地把边界条件、隐含逻辑全塞进提示词,试图堵死模型乱猜的空间。但写提示词的成本陡增,而且你还是没法提前知道它到底理解对了没有。问题没解决,只是换了个形式。


Andrej Karpathy 也吐槽过:



模型代表你做出错误假设,然后就径直跑下去而不检查。它们也不会管理自己的困惑,不会寻求澄清,不会显示不一致之处,不会呈现权衡,不会适时反推,而且它们还是有点太谄媚了。



现在行业里流行 SDD ( Spec-Driven Development ,规格驱动开发),提前写 Spec 文档明确需求边界,能减少歧义。但这套流程有个盲区:没法提前确认 AI 是不是真的读懂了,理解偏差还是要等 AI 执行完之后才暴露出来,有些甚至还需要靠你自己去检查才能发现。


怎么办?


开源项目 luckybilly/understand-first 就是解决这个问题的:


强制 AI 在执行任务之前,先完整输出它对提示词的理解。不用等漫长的生成结束,你马上就能看到它接下来要做什么,有没有曲解你的意思、有没有擅自加戏。发现偏差立刻纠正,不用事后返工。


效果是这样的:


demo.png


demo 2


欢迎试用,觉得不错的话 star 🌟 支持一下哦~


开源地址:https://github.com/luckybilly/understand-first


支持 ClaudeCode 、Codex 、Cursor 、KimiCode 、WorkBuddy... 等国内外各种 Agent (把链接贴给你的 Agent 让 AI 自己给你安装即可).

最新回复 (9)
  • TimePPT 06-30 14:02
    1
    @Livid 推广
  • lichdkimba 06-30 14:25
    2
    这和 plan mode 相比有什么优势?
  • bush911 06-30 14:33
    3
    看不懂它就不是好 AI
  • 8888888888 06-30 14:41
    4
    这不是套娃吗
  • nicaiwss 06-30 14:45
    5
    这种简单的功能一般官方都有实现,比如 plan 模式
  • luckybilly 楼主 06-30 15:04
    6
    @lichdkimba 可以看作是轻量版的 plan 模式,但 plan 模式我们一般是在有较大的工作要做之前才进入 plan 来制定计划。 这个库是每次都让 AI 将它的理解展示出来,我们平时写的提示词一般没有那么严谨,AI 容易理解不完整。
  • skuuhui 06-30 15:31
    7
    首先,transformer 大模型没有懂不懂的概念,即便他完整输出了对提示词的理解,他做的时候也不一定按照前面自己说的话的去做并且能带来注意力上的问题。
    其次,你不要把它拟人,而是要把你自己的语言拟 AI 。不转变这样的思想,其他的所有东西都是画蛇添足。
    再者,你的这个场景,我个人常用的解决方案是先和 seesion1 (这一步不考研模型编码能力,考验的是知识库,项目记忆,代码阅读,连网搜索的能力)进行共创(你一言我一语),知道我觉得设计的差不多了,让他形成文档。开个 session2 ,让他按照文档去 coding 。但这个本质上解决的不是它所谓的“理不理解你“的问题,而是你知不知道你想干什么的问题。
  • r6cb 06-30 16:12
    8
    你这和让 ai 先写一份 spec 有区别吗
  • luckybilly 楼主 06-30 16:34
    9
    @skuuhui 有大的任务,先用制定实施计划再让新 session 根据计划去执行,这没什么问题,是 SDD 推荐的做法,但你每件事都、每一轮对话这么折腾开多个 session 不嫌麻烦吗?

    按你说的 session2 中出现问题需要调整,最简单的方式不是在 session2 里追问更能高效解决吗?除非问题比较大,否则为什么要再去开 session3 来单聊。

    这个工具并不是替代计划的,只是个 **轻量级** 的意图对齐,能提前感知,避免执行的结果不是你真正想要的,用这个工具后能及时打断,不至于浪费时间再去一轮轮纠正,我补充的那个例子就是个比较典型的场景。你总不会是什么都先让 AI 输出计划再做吧,一些简单的任务不是直接对话去执行最高效吗?
* 帖子来源V2EX
返回