Redian新闻
>
AI学不会的“两面三刀”,对基础模型发展很重要

AI学不会的“两面三刀”,对基础模型发展很重要

财经

后台回复【商论入群】即刻入群体验两周主编深度领读!

OpenAI公司发布的新语言模型ChatGPT爆火,这个机器人不仅可以模仿人类生成对话,甚至还可以写故事和理论性论文,引发热议。此前,AI在另一个游戏中的突破也值得关注——除了要有制定制胜策略的推理能力,一个成功的《外交》玩家还必须具备实施策略的沟通能力——这正是AI程序“西塞罗”(Cicero)的特别之处。研发者Meta团队运用大量数据训练出来的大型语言模型能够像真人一样谈判、说服、合作和竞争。但“两面三刀”才是这个游戏的精髓,而尽管西塞罗确实“在游戏中有策略地对其他玩家隐瞒了信息”,它实际上并没有背刺过任何对手。商论App内搜索关键词【AI】获取更多主题文章。


《经济学人·商论》2022-12-13

AI and Diplomacy

AI与《外交》

人工智能选手又拿下一个游戏

这一回玩的游戏涉及谈判和耍两面派


玩双陆棋要赢很容易。象棋要难些。围棋就更难了。但是对于一些发烧友来说,直到现在人工智能(AI)才算真正跻身游戏俱乐部——因为它已经证明自己在玩《外交》(Diplomacy)时能屡屡击败人类。在此先向那些不熟悉这款游戏的人说明一下它的玩法:它的棋盘是一幅一战前的欧洲地图(只不过黑山不见了,原因不得而知)。参与者最好有七个,各自扮演以下大国中的一个:奥地利、英国、法国、德国、意大利、俄罗斯和土耳其。每个国家都有陆军和海军,以及能够支持军队的基于地理位置的资源,它们可以动用军队占领邻国的领土,从而有资本扩充自己的军队,同时令其他国家丧失资源和兵力。

“西塞罗”(Cicero)在学习玩这个游戏时上手很快。这是马克·扎克伯格手下的一群员工设计出来的一个程序,他们自称“Meta基础人工智能研究外交团队”(Meta Fundamental AI Research Diplomacy Team)。据该团队在《科学》杂志上的描述,他们让西塞罗加入了一个《外交》线上游戏联盟,它在里面玩了40场游戏,最后荣登排名前10%的玩家之列——没有一个人抱怨它不是个真人。

在之前所有的人工智能游戏项目中,程序都是通过强化来学习的。西塞罗也是这样被教导的。但这只是训练的一部分。除了要有制定出制胜策略的推理能力,一个成功的《外交》玩家还必须具备实施策略的沟通能力。...此,Meta团队的重要贡献是使用自然语言处理来增强强化学习。团队先将一个对语言有着基线理解的预先训练过的模型用于西塞罗,再利用过去40,000多场游戏中的对话对模型做微调,让它学会《外交》特有的言语模式。...因此,西塞罗能够谈判、说服、合作和竞争。......

  • 欢迎打开商论App订阅后阅读完整文章

  • 欢迎在商论中搜索关键词【AI】阅读更多本文内容


想要一站式掌握热门主题,更好读懂《经济学人》?《经济学人·商论》主编深度领读系列帮你高效入门

📢现在后台回复【商论入群】

即刻入群体验两周主编深度领读!

助你理解全球大趋势、学习新知,拓展视野


点击“阅读原文”,优惠订阅全年商论↓

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
10亿参数、多项SOTA,智源开源视觉基础模型EVA强化学习也有基础模型了!DeepMind重磅发布AdA,堪比人类的新环境适应能力克而瑞发布《2022不动产数字化转型发展报告》,深度解读不动产数字化发展现状与趋势获诺奖的美联储前主席,对中国有一个很重的判断为什么人工智能的未来是灵活、可重用的基础模型MIUI14称要自砍三刀;115再次推出长期VIP;中兴Axon 40 Ultra航天版发布OMA东京新作“两面建筑”动工;全国重点文保单位竟变方舱?|建筑周回放 Vol.8俞敏洪新书: 爸妈们做好这15件事,对孩子一生很重要!建议收藏必读!社区书记发言应与公众共情,舆论对基层工作者也应多包容美国入境档案--弗洛伊德,荣格及萨德·费伦齐1909年纽约入境【直播预告】对基因治疗产品非临床研究策略的思考#关爱心理健康# 你很重要,你的工作很重要微软团队发布第一个基于AI的天气和气候基础模型 ClimaX大模型如何可靠?IBM等学者最新《基础模型的基础鲁棒性》教程|NeurIPS 2022他被连刺三刀,仍未松手…网友:“安欣”一直都在!重访科州翠湖上幼儿园的娃能有多“两面派”,发糕:偷偷给你们看看睡前的我用CNN做基础模型,可变形卷积InternImage实现检测分割新纪录!一边是马云,一边是星云,中国人的“两面”乳糖不耐受和牛奶过敏千万别搞错进展很快了!超出人们预期在美国263.肺癌?精神病、电台律师抗疫的“两派”,由毫无科学基础的写手所虚构女儿这件比轻羽绒还暖和,几十元闭眼入/还可两面穿(明10点开团)双剑合璧---GLP-1R/GIPR 双激动剂2022 Top10自监督学习模型发布!美中两国8项成果霸榜美国公私立学校对基础教育的不重视让华人家长很揪心!瞎跑步,膝盖磨损如80岁老人!学会零基础学跑步很重要!女儿这件比轻羽绒还暖和,几十元闭眼入/还可两面穿丨开团赵露思开撕关晓彤?口技社公子争家产?李承铉戚薇无脑营销?​湾湾老公主两面派?我向自己砍了“两刀”,熬过了跨境电商的至暗时刻微软亚洲研究院持续迭代BEiT,为通用基础模型的大一统发展奠定基础百亿、千亿级参数的基础模型之后,我们正在步入以数据为中心的时代?降价,对马斯克真的很重要民警为救自残轻生女子被连刺三刀【冯站长说安全】2023年2月4日
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。