AI的未来不是大模型,也不是端到端:Meta向我们证明了这一点
选自garymarcus.substack
「人类的可贵品质在于寻求和追随真理。」——西塞罗
游戏的当前状态; 之前所有历史动作和历史对话; 语言模式知识,基于类似于 GPT-3 的纯语言模型,这让 Cicero 知道如何合理回应其他玩家; 了解语言与动作的关系,这让 Cicero 知道如何告诉盟友或潜在盟友它计划做什么; 每条交流消息的间隔时间(以秒为单位)。
在线平台上进行的 125300 场人类游戏的语料库(其中 40400 场包括对话,总共有 12900000 条单独信息); 一个大型的语言模型,似乎是在数十亿个单词的基础上训练出来的,在游戏对话的语料库中进一步微调; 数以千计的专家生成的注释,评估由初步版本的 Cicero 产生的信息的质量; 大量的合成数据集,其中许多是手工构建的,用于训练各种模块。例如,为了训练排除无效信息的过滤器,他们创建了一个手工构建的无效信息集;另一个数据集训练了 Cicero,使其摆脱了错误计算棋盘上实体的倾向;还有一个数据集是为了提高其对否定句的理解,一个自我博弈的语料库被用来进行强化学习等等。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章