ICLR 2023 | PromptPG:当强化学习遇见大规模语言模型
机器之心编辑部
PromptPG 方法在回答问题的准确性上超过最优基准(Few-shot CoT GPT-3)5.31%。
论文链接:https://arxiv.org/abs/2209.14610 代码链接:https://github.com/lupantech/PromptPG 项目主页:https://promptpg.github.io 数据可视化:https://promptpg.github.io/explore
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章