大模型的最大bug,回答正确率几乎为零,GPT到Llama无一幸免
机器之心报道
编辑:泽南、陈萍
大模型的逻辑?不存在的。
论文链接:https://arxiv.org/abs/2309.12288 GitHub 链接:https://github.com/lukasberglund/reversal_curse
尝试不同系列、不同大小的模型; 微调数据集中既包含 <name> is < description > 句式,也包含 < description > is < name > 句式; 对每个 < name> is <description > 进行多重解释,这有助于泛化; 将数据从 < name> is <description > 更改为 < question>?<answer> 。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章