斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果
编辑:蛋酱、Panda W
大模型出现后,涌现这一术语开始流行起来,通常表述为在小规模模型中不存在,但在大规模模型中存在的能力。但斯坦福大学的研究者对 LLM 拥有涌现能力的说法提出了质疑,他们认为是人为选择度量方式的结果。
第一,在「任务 - 度量 - 模型系列」三元组的「群体层面(population level)」上,当选择使用非线性和 / 或非连续度量来评估模型性能时,模型应当会在任务上表现出涌现能力。 第二,对于展现出了涌现能力的特定「任务 - 度量 - 模型系列」三元组,如果将度量改变成线性和 / 或连续度量,那么涌现能力应该会被消除。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章