Redian新闻
>
AI学不会的“两面三刀”,对基础模型发展很重要

AI学不会的“两面三刀”,对基础模型发展很重要

财经

后台回复【商论入群】即刻入群体验两周主编深度领读!

OpenAI公司发布的新语言模型ChatGPT爆火,这个机器人不仅可以模仿人类生成对话,甚至还可以写故事和理论性论文,引发热议。此前,AI在另一个游戏中的突破也值得关注——除了要有制定制胜策略的推理能力,一个成功的《外交》玩家还必须具备实施策略的沟通能力——这正是AI程序“西塞罗”(Cicero)的特别之处。研发者Meta团队运用大量数据训练出来的大型语言模型能够像真人一样谈判、说服、合作和竞争。但“两面三刀”才是这个游戏的精髓,而尽管西塞罗确实“在游戏中有策略地对其他玩家隐瞒了信息”,它实际上并没有背刺过任何对手。商论App内搜索关键词【AI】获取更多主题文章。


《经济学人·商论》2022-12-13

AI and Diplomacy

AI与《外交》

人工智能选手又拿下一个游戏

这一回玩的游戏涉及谈判和耍两面派


玩双陆棋要赢很容易。象棋要难些。围棋就更难了。但是对于一些发烧友来说,直到现在人工智能(AI)才算真正跻身游戏俱乐部——因为它已经证明自己在玩《外交》(Diplomacy)时能屡屡击败人类。在此先向那些不熟悉这款游戏的人说明一下它的玩法:它的棋盘是一幅一战前的欧洲地图(只不过黑山不见了,原因不得而知)。参与者最好有七个,各自扮演以下大国中的一个:奥地利、英国、法国、德国、意大利、俄罗斯和土耳其。每个国家都有陆军和海军,以及能够支持军队的基于地理位置的资源,它们可以动用军队占领邻国的领土,从而有资本扩充自己的军队,同时令其他国家丧失资源和兵力。

“西塞罗”(Cicero)在学习玩这个游戏时上手很快。这是马克·扎克伯格手下的一群员工设计出来的一个程序,他们自称“Meta基础人工智能研究外交团队”(Meta Fundamental AI Research Diplomacy Team)。据该团队在《科学》杂志上的描述,他们让西塞罗加入了一个《外交》线上游戏联盟,它在里面玩了40场游戏,最后荣登排名前10%的玩家之列——没有一个人抱怨它不是个真人。

在之前所有的人工智能游戏项目中,程序都是通过强化来学习的。西塞罗也是这样被教导的。但这只是训练的一部分。除了要有制定出制胜策略的推理能力,一个成功的《外交》玩家还必须具备实施策略的沟通能力。...此,Meta团队的重要贡献是使用自然语言处理来增强强化学习。团队先将一个对语言有着基线理解的预先训练过的模型用于西塞罗,再利用过去40,000多场游戏中的对话对模型做微调,让它学会《外交》特有的言语模式。...因此,西塞罗能够谈判、说服、合作和竞争。......

  • 欢迎打开商论App订阅后阅读完整文章

  • 欢迎在商论中搜索关键词【AI】阅读更多本文内容


想要一站式掌握热门主题,更好读懂《经济学人》?《经济学人·商论》主编深度领读系列帮你高效入门

📢现在后台回复【商论入群】

即刻入群体验两周主编深度领读!

助你理解全球大趋势、学习新知,拓展视野


点击“阅读原文”,优惠订阅全年商论↓

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
民警为救自残轻生女子被连刺三刀【冯站长说安全】2023年2月4日俞敏洪新书: 爸妈们做好这15件事,对孩子一生很重要!建议收藏必读!克而瑞发布《2022不动产数字化转型发展报告》,深度解读不动产数字化发展现状与趋势他被连刺三刀,仍未松手…网友:“安欣”一直都在!乳糖不耐受和牛奶过敏千万别搞错美国公私立学校对基础教育的不重视让华人家长很揪心!2022 Top10自监督学习模型发布!美中两国8项成果霸榜10亿参数、多项SOTA,智源开源视觉基础模型EVA孩子觉得学习太难、学不会,怎么办? 心理专家放出3个大招……褚时健,他们学不会在美国263.肺癌?精神病、电台律师双剑合璧---GLP-1R/GIPR 双激动剂MIUI14称要自砍三刀;115再次推出长期VIP;中兴Axon 40 Ultra航天版发布瞎跑步,膝盖磨损如80岁老人!学会零基础学跑步很重要!【直播预告】对基因治疗产品非临床研究策略的思考微软亚洲研究院持续迭代BEiT,为通用基础模型的大一统发展奠定基础降价,对马斯克真的很重要学不会沟通就永远也升不了职,领导者必学的4大沟通技巧!用CNN做基础模型,可变形卷积InternImage实现检测分割新纪录!我向自己砍了“两刀”,熬过了跨境电商的至暗时刻社区书记发言应与公众共情,舆论对基层工作者也应多包容上幼儿园的娃能有多“两面派”,发糕:偷偷给你们看看睡前的我#关爱心理健康# 你很重要,你的工作很重要大模型如何可靠?IBM等学者最新《基础模型的基础鲁棒性》教程|NeurIPS 2022百亿、千亿级参数的基础模型之后,我们正在步入以数据为中心的时代?一边是马云,一边是星云,中国人的“两面”强化学习也有基础模型了!DeepMind重磅发布AdA,堪比人类的新环境适应能力微软团队发布第一个基于AI的天气和气候基础模型 ClimaX重访科州翠湖为什么人工智能的未来是灵活、可重用的基础模型进展很快了!超出人们预期OMA东京新作“两面建筑”动工;全国重点文保单位竟变方舱?|建筑周回放 Vol.8获诺奖的美联储前主席,对中国有一个很重的判断美国入境档案--弗洛伊德,荣格及萨德·费伦齐1909年纽约入境抗疫的“两派”,由毫无科学基础的写手所虚构
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。