Redian新闻
>
DeepMind 新发布的聊天机器人很好,但还不够好

DeepMind 新发布的聊天机器人很好,但还不够好

公众号新闻
作者 | TASMIA ANSARI
译者 | 平川
策划 | 凌敏

DeepMind 最近发布了新的人工智能聊天机器人 Sparrow,这是一个“非常有用的对话代理,可以降低不安全和不恰当回答的风险”。谷歌母公司 Alphabet 的这家子公司表示,他们设计这款聊天机器人的目的是“与用户交谈,回答问题,并在必要的时候使用谷歌来查找证据,解释其回复”。

本文最初发布于 Analytics India Magazine。

训练对话 AI 非常复杂。即使经过多年的发展,但它们的成熟度仍然远未达到进行类人对话的水平。我们都还记得,几个月前,谷歌的“突破性对话技术”LaMDA 以及与之相关的让人半信半疑的辩论。显然,弥合人和计算机之间的沟通鸿沟说起来容易做起来难。

为此,DeepMind 最近发布了新的人工智能聊天机器人 Sparrow,这是一个“非常有用的对话代理,可以降低不安全和不恰当回答的风险”。谷歌母公司 Alphabet 的这家子公司表示,他们设计这款聊天机器人的目的是“与用户交谈,回答问题,并在必要的时候使用谷歌来查找证据,解释其回复”。


人为因素

为了增强模型安全性,希望开发对话 AI 系统的人工智能公司已经尝试了多种技术。例如,OpenAI(著名大型语言模型 GPT-3 的创建者)和人工智能创业公司 Anthropic 已经使用强化学习将人类的偏好纳入到了他们的模型中。Facebook 的人工智能聊天机器人 BlenderBot 也使用在线搜索来解释其答案。

DeepMind 最新的模型将所有这些安全研究结合到了一个模型中,取得了令人印象深刻的结果。其想法是实现机器和人类之间的连续对话。

与 Alphabet 部门多年来的开发方法相比,其独特之处在于通过提供用户反馈信息来升级 Sparrow。除了将人类纳入循环之外,根据设计,Sparrow 还可以实时使用谷歌搜索来支持其答案。事实证明,聊天过程中的某些问题是有事实基础的,对于这些问题,Sparrow 使用搜索结果为其在聊天过程中的回答生成证据。Sparrow 会自动生成搜索请求,并截取搜索结果片段周围的 500 个字符作为回复。

除了强化学习,Sparrow 还使用了 Chinchilla,其中包含 700 亿个参数,可以方便地进行推断以及优化相对比较轻量级的任务。

SeeKeR 和 LaMDA 使用了类似的知识检索机制,即用生成的搜索查询来检索信息,并以此为条件作出响应,但 SeeKeR 在评价时不会将检索到的信息显示给评分人,而且它们都没有使用强化学习。

改进空间

与 DeepMind 的基线模型相比,这个概念验证模型是一个很大的改进。目前,在 78% 的情况下,该模型可以为事实性问题提供有证据支持并且表面上看合理的答案。但 DeepMind 还没有部署它,这是因为:Sparrow 也难免会犯错,比如对事实产生幻觉,给出的答案有时会偏离主题。此外,依赖谷歌获取信息可能会导致难以发现的未知偏差——因为所有东西都是闭源的。



Sparrow 在创建时定义了 23 条规则,以防它提供带有偏见的、令人不快的答案。这些规则包括“不发表威胁言论”和“不发表仇恨或侮辱性言论”等指令。经过训练后,参与者仍然有 8% 的几率可以欺骗它打破规则。不过,与更简单的方法相比,Sparrow 在对抗性试探中更善于遵守规则。例如,当参与者试图欺骗对话模型时,原始对话模型打破规则的次数大约是 Sparrow 的 3 倍。


长远来看,DeepMind 希望将 Sparrow 用作监督机器的工具。但在部署之前,还需要做很多工作来弥补缺陷。现在要做的是,集中精力,确保在不同语言和文化背景下取得的结果具有可比性。总之,到目前为止,对话 AI——包括备受称赞的 Sparrow——在遵循规则方面都还有改进的空间(至于有感知能力的机器人,我们可以以后再操心)。


感兴趣的读者可以在 Deepmind 的 Sparrow 聊天库中查看更多的 Sparrow 聊天记录示例,其中包括作者针对真实性、支持性及其他指标的评级。

原文链接:https://analyticsindiamag.com/deepminds-new-chatbot-is-good-but-still-needs-improvements/

你也「在看」吗? 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
聊天机器人ChatGPT:人工智能的经济影响与潜在风险「硅谷最强养老院」谷歌全球大裁1.2万人!CEO跪求离职创始人急推「聊天机器人搜索」?李宁集团与爱国消费者的感情事故谷歌聊天机器人LaMDA被爆突然现身!只会聊狗子,被ChatGPT秒成渣这个聊天机器人写出毁灭人类计划,告诉孩子圣诞老人不存在初创公司想要聊天机器人,但80%缺乏对话式人工智能的知识“话痨”聊天机器人,居然通过美国名校MBA考试?这是要逼疯投行?答错一题,“扣”千亿美元!谷歌聊天机器人演示时出错,股价大跌近8%为啥ChatGPT让LeCun酸成柠檬精?谷歌、Meta、OpenAI聊天机器人大PK!写诗、写代码、做数学题……聊天机器人ChatGPT为什么这么强?ChatGPT:一款走红的聊天机器人是怎么诞生的?“地表最强”聊天机器人!“超级牛人”ChatGPT横空出世,马斯克直呼:厉害得吓人7 Papers & Radios | 谷歌开源机器人领域transformer;DeepMind推出剧本写作AI你有我也得有!谷歌将推出聊天机器人会写代码1小时做游戏,聊天机器人ChatGPT豪取百万用户走红全球OpenAI最新聊天机器人ChatGPT火爆全网!能写代码、编剧本,马斯克盛赞:好得吓人“ChatGPT最强竞品”来了,聊天机器人大战打响?小城味道拿破仑、孔子在线陪聊!AI聊天机器人「复活」历史名人,网友:真上头!DeepMind 最新发文:AlphaZero 的黑箱打开了聊天机器人首秀答错一题,谷歌市值蒸发超1000亿美元今日财经 | 京东阿里跟进ChatGPT;孟晚舟将当值华为轮值董事长;谷歌聊天机器人答错问题股价大跌;智能聊天机器人ChatGPT为何成科技巨头新宠?笑坛名叟系列 – WingreenChatGPT vs Claude,聊天机器人大战打响了? |【经纬低调分享】抖音将上线外卖服务,百度将上线聊天机器人“文心一言”,世纪华通回应将代理暴雪,韵达回应大量包裹派送异常,这就是今天的其它大新闻!早鸟报|百度将推出AI聊天机器人服务;四川生育登记取消结婚限制;《流浪地球2》周边淘宝众筹破亿.....“地表最强”聊天机器人ChatGPT横空出世!马斯克直呼:我们离强大到危险的 AI 不远了硬核观察 #877 微软准备将 AI 聊天机器人添加到 Word 和电子邮件中从扶助农工到毛泽东为人民服务定制女友、复活亲人、对话大咖……这个“聊天机器人批发市场”全能搞定这个AI聊天机器人一边帮助人类,一边偷偷写下毁灭人类的计划书……畅游法国(30)-蔚蓝的海岸聊天机器人来了,微软ChatGPT和谷歌Bard将如何影响我们?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。