「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光
新智元报道
新智元报道
【新智元导读】13.8和13.11哪个大?这个问题不光难倒了部分人类,还让一票大模型折戟。AI如今都能做AI奥数题了,但简单的常识问题对它们依然难如登天。其实,无论是比大小,还是卷心菜难题,都揭示了LLM在token预测上的一个重大缺陷。
虽然13.8看起来更大,因为它小数点后的数字更少,但13.11实际上更大。这是因为13.8相当于13.80,而13.80小于13.11。
Python中用9.11减去9.9的结果是-0.79。这一偏差是由于Python中处理浮点运算的方式造成的,这种方式可能导致小的精度误差。实际的预期结果应该是0.21。
LLM全军覆没
9.11=9 +1/10+1/100=9.11
9.9=9+9/10=9.90
我们可以看到,9.11比9.90大0.01(百分之一)。
prompt的影响,真的很大
为什么会这样?剖开LLM大脑
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章