大模型不会数数!违反常识的问题

崮生 2026-06-30 21:15 1

现在这个时代似乎大模型什么都能干,每天自媒体都是大模型干翻这个那个,前端又被杀了。


但是他不会数数!不信您可以试试发一段文本给大模型让他输出一下文本中的所有名词的位置,十有八九是会有错误的位置。


对于这个问题我不是大模型专家,不知道究竟是为什么,但是事实上就是他数数不太行


如何解决这个问题?


但是有些场景是依赖大模型输出对应的下标的,这似乎又是必须依赖大模型数数了。


例如利用大模型标记文档中的所有写错了的文字。


既然直接数数不行,但是如果你让大模型去复述文本却能得到很高的准确率。


那么自然而然的就能想到,将文本先按字拆分,然后将下标和文字一起给大模型,例如 : 1:大 2:模 3:型 4:不 5:会 6:数 7:数​ 这样之后输出的下标准确率就会飙升。


下面是一个简单的尝试,显而易见的 带坐标输入 的方案准确率更好


更好的解决方案


在经过一段时间的尝试和摸索之后,我发现就是结合文本分段,再加上一个上下文的一个后期的坐标修正是能够达到最佳的一个体验的。


例如给每一个段落分配一个id交给大模型,并且让他输出的时候携带相关文本前面一段文本和后面一段文本,输出示例: {before:‘交给’,target:‘大模型’,after:‘,并且’,snippet:‘片段id’}​


这样基本能达到 95% 以上的准确率了。




上面是一些拙见,欢迎指正交流更好的方案




实际应用场景,文档校对demo演示:


最新回复 (9)
  • 亓水 06-30 21:18
    1

    我感觉可能是因为大模型是以token为单位而不是以实际每个字(ASCII,UTF8)对应数量来数数的?数对的可能是依赖python等语言数的?

    或许可以放到token拆分里面看看和大模型给出的答案是否相同

  • 崮生 楼主 06-30 21:22
    2

    这是可能的,但也不太对,因为已经常见词肯定会算一个token,但是他有时候能数对

  • yeluo001 06-30 21:34
    3

    大语言模型原理是概率预测生成,是根据前面内容去猜后面的内容,每一步都是概率匹配,所以数数数不准很正常

  • HeriX 06-30 21:36
    4

    模型没有往这些方面训练, 之前常见的LLM出错的简单问题

    xxx+yyy = ? 小学数学不过关

    strawberry有几个r? 数不对

    之类的问题

    不过现在很多模型都专门训练过, 类似的都能回答对了

    比如调用计算器来计算数字等等

  • Caphhh 06-30 23:12
    5

    很正常, 大模型用的是 token, 而不是单字来计算的


    你如果真的有计数的需求, 应该明确告诉 llm 写一个 Python 脚本来数数




    你可以把这篇帖子发给 llm 让他联网搜索一下, 大概就是这个原因

  • Wowfool 06-30 23:17
    6

    如果是gpt让他数数 他大概率思考的时候会写python代码来计数

  • 崮生 楼主 07-01 08:52
    7

    @HeriX @Caphhh @bestdecoy


    感谢几位讨论。


    其实文中后半部分主要想表达的就是这个思路:把精确定位交给程序或工具,而不是依赖模型自己去数。


    无论是工具调用还是我文中提到的带坐标输入、分段定位,本质上都是先建立位置映射,再交给 AI 做语义判断,所以大家说的其实是一类方案。

  • 崮生 楼主 07-01 08:55
    8



    AI是这么回复的,我觉得他说的可能也有一点的道理吧。

    这也可以解释其他的几个楼层的人所回复的使用agent的一些方案为什么可以行,因为就是把这个状态迁移到了外部,而不是大模型内部。

  • 招财进宝 07-01 09:01
    9

    发一段文本给大模型让他输出一下文本中的所有名词的位置



    emmm如果是一段英文呢 ^-^

* 帖子来源Linux.do
返回