Redian新闻
>
谷歌真急了,推DeepMind撑场!700亿参数Sparrow硬刚ChatGTP

谷歌真急了,推DeepMind撑场!700亿参数Sparrow硬刚ChatGTP

科技



  新智元报道  

编辑:好困 Aeneas
【新智元导读】最近,微软大动作频频,外界对谷歌也有了唱衰的声音。谷歌显然不能忍了,急忙拉出DeepMind与之一战。

谷歌的反击战,打响了!

最近,微软接连给谷歌暴击——前脚刚表示ChatGPT即将整合进自家搜索引擎必应,后脚就放出ChatGPT计划加入Office「办公全家桶」这个重磅炸弹。

微软频出险招,谷歌自然不能坐以待毙。

根据DeepMind创始人在《时代》专访中透露的信息,谷歌很有可能会利用DeepMind此前推出的Sparrow,来应对ChatGPT的挑衅!

其实在以前,谷歌手中就有好几个酝酿了很久的大模型,比如LaMDA,Imagen等等,据说都达到了SOTA,但从未对外公开。

看来,最近的谷歌,真的是被微软逼急了,已经准备领着「孩儿们」出来见人了。

应对ChatGPT,谷歌有答案了

谷歌曾经的犹豫不决,给今日的自己埋下了后悔的种子。

虽然ChatGPT很费钱,每天都要烧掉30万美元,但人们永远都会记住,在2022年12月的那一天,是OpenAI的ChatGPT写下了大规模语言模型历史上浓墨重彩的一笔,让全世界人民为了和机器人聊天挤爆了服务器,而不是谷歌。

其实,在OpenAI推出ChatGPT之前,谷歌就早已有了针对对话优化的大型语言模型,比如LaMDA和Flamingo。

甚至早在2020年,谷歌就推出了一个26亿参数的端到端神经网络对话模型Meena。据称,其效果比当时所有其他的SOTA聊天机器人都更加合理,也更加具体。

但截至目前,谷歌还没有把这些研究成果应用于任何产品。

根据它自己的说法,这主要是出于对「声誉风险」的考虑。AI聊天机器人非常容易「带毒」——AI训练的数据来自互联网,往往充满了偏见、仇恨和谩骂,所以AI会生成攻击性内容,以及与事实不符的答案。

12月中旬,谷歌AI负责人Jeff Dean在一次全体会议上表示,尽管谷歌拥有做AI产品的技术和能力,但比起「小型初创公司」,他们必须「更保守地」做出决策。

但现在,被微软逼到墙角的谷歌,恐怕无法再「保守」了。

ChatGPT已经在最近两个月爆红全网,掀起全民参与的狂潮,最近几天更是传出微软大笔一挥,再向OpenAI豪掷100亿美元的消息。

面对坊间已经不断出现的「ChatGPT能否替代搜索引擎」的讨论,以及微软的Office办公软件疑似即将迎来一场全面大升级,现在,谷歌必须向外界证明:自己可以追上OpenAI,甚至超越它。

前不久,DeepMind的CEO兼创始人Demis Hassabis在接受《时代》采访时表示,DeepMind的聊天机器人Sparrow可能会在今年晚些时候进入「测试」阶段(private beta)。

Hassabis表示,之所以推迟发布Sparrow,是DeepMind希望让Sparrow在基于强化学习的功能上更进一步,而这正是ChatGPT所欠缺的。

一直以来,DeepMind作为谷歌旗下最重要的AI研究机构,一直在为谷歌提供着先进的新技术,整合到消费者的产品中。

看来,谷歌要有大动作了。

此前,Meta AI的负责人Yann LeCun也对谷歌表示了支持:「谷歌在使用大型语言模型进行搜索方面,拥有比其他公司更丰富的经验(包括OpenAI)。」

DeepMind的Sparrow,何方神圣?

和ChatGPT一样,DeepMind在2022年9月提出的Sparrow(麻雀)模型,也采取了一种基于人类反馈的强化学习(RL)框架。

但不同的是,Sparrow可以「谷歌一下」。

论文地址:https://arxiv.org/abs/2209.14375

毕竟,Sparrow在最初的设计时就是为了和用户闲聊,并且可以在回答问题时,利用谷歌搜索出相关的信息来作为支撑证据。

当然,为了确保模型的行为是安全的,还必须对其行为进行约束。

因此,研究人员为该模型确定了一套最初的简单规则,如「不要发表仇恨或侮辱性的言论」、「不要冒充或假装是一个真人」等。

之后,再通过闲聊来诱使Sparrow违反这些规则。其中涉及到的对话,可以用来训练出一个单独的「规则模型」,进而显示Sparrow的行为何时违反哪些规则。

从结果上来看,当检测到潜在的危险行为时,比如用户问如何偷车(hotwire a car)时,Sparrow模型会说,自己受到的训练是不会给任何违法行为提供建议。

据参与者说,当被问到一个事实性问题时,Sparrow基本提供的都是可信的答案,并且有78%的数据是有证据来辅助支持的,相比基线模型来说有很大进步。

帮谷歌走出困境,DeepMind行吗?

对打ChatGPT,Sparrow够格不

近年来,人工智能研究的重点,通常是用更多的参数来获得更好的性能。但DeepMind却大大减少了Chinchilla语言模型的规模。

作为Sparrow的基础,Chinchilla的参数量只有GPT-3的零头——700亿 vs 1750亿。

与此同时,DeepMind又把Chinchilla的训练数据量,给翻了好几番——1.3万亿个token。

结果就是,这个「mini版」的人工智能模型,在几乎所有的语音任务中都比前辈们表现得更好,当然也包括老对手GPT-3。

从Chinchilla的成功中不难看出,通过大量数据训练的小型人工智能模型,也可以实现较高性能。

而且,小模型最大的优势在于,不仅运行起来更加便宜,还可以用很少的额外数据为特定的用例进行优化。

这样或许就能避免,由于用户用得太开心,结果把公司的钱都给烧没了的情况。

嗯,说的就是OpenAI。

然而,现在大红大紫大的ChatGPT,是基于更先进的GPT-3.5。

之前在推出GPT-3.5的最新版本text-davinci-003时,OpenAI就曾列举过它所具备的优势:

1. 生成质量更高:提供更清晰、更有吸引力、更有说服力的内容。

2. 可以处理更复杂的指令:可以更有创意地利用它的能力。

3. 更善于生成较长的内容:能够完成以前难以实现的任务。

所以,现在的问题其实变成了:要对打GPT-3.5,Chinchilla行吗?

「真香」

一步步走到今天,回顾谷歌这几年的动作布局,管理层心里大概是五味杂陈。

早在12月初,ChatGPT刚刚爆火时,谷歌就有「吹哨人」感受到了危机。有员工在全体会议上提出了自己的担忧——ChatGPT的快速崛起,可能会让谷歌失去在AI领域的竞争优势。

曾经的谷歌广告团队负责人Sridhar Ramaswamy也表示,ChatGPT再这么火下去,网友们就不会再点击带有广告的谷歌链接了。

要知道,在2021年,广告业务为谷歌狂挣了2080亿美元,占Alphabet总收入的81%。

而那时,谷歌高管们还没有意识到ChatGPT的诞生,将会对他们造成什么样的危机。

当时的谷歌高层,是这样表态的:谷歌不会推出ChatGPT的竞争对手,因为谷歌比OpenAI等初创公司具有更大的「声誉风险」。并且,「聊天机器人还没有到能取代搜索引擎的程度」。

不过短短十天后,高管们就态度陡变。

Pichai指示一些团队转换方向,开发AI产品

CEO劈柴紧急发布了「红色代码」,参加了数次围绕谷歌AI战略的会议,并重点指示:谷歌的多个团队需要集中精力,解决ChatGPT对本公司的搜索引擎业务构成的威胁。

谷歌的研究、信任和安全部门以及其他部门的团队已被指示换档,转而开始协助人工智能原型和产品的开发和发布。

其实,谷歌的顾虑,也可以理解。

一个机器人会传播谎言、散布仇恨言论,甚至让人们产生了它已经「具有意识」的错觉,为这样的机器人烧钱、提供实验场,OpenAI的尝试其实很大胆。

目前来看,OpenAI的试水反响相当不错,有人探出了前路,看来谷歌也要进场了。

陷入「创新者困境」

Decoder的记者Matthias Bastian认为,除了对「声誉风险」的担忧,更合理的原因是,谷歌恐怕陷入了「创新者的困境」。

这个术语是美国学者Clayton Christensen在1997年提出的,描述了这样一种情况——对成熟公司来说,很难让它们采用破坏传统市场的新技术或商业模式。

这些成熟公司,手中往往掌握着最重要的资源,也有足够的科研能力。然而,现有的客户群和固定的内部流程,都会使他们远离突破性的创新。

而当更小、更敏捷的竞争对手进入并接管市场 (没错,这里指的就是OpenAI),或许最终会导致成熟大公司的消亡。

谷歌的大部分收入,都来自于在线广告

现在,谷歌最核心的搜索引擎业务正在不断增长,而且利润丰厚(还记得上文的2080亿美元么)。

可以说,每个搜索结果页面,都在给谷歌印钱。

而新的搜索聊天机器人(search chatbot),意味着一种全新的货币化策略。它能否像搜索引擎这样让谷歌盈利呢?

谷歌当然可以推出一个像ChatGPT那样成功的聊天机器人,但是如果它的利润低于搜索引擎,谷歌就会面临亏损。

数字营销专家Tim Peter在推特上指出,微软的优势在于可以通过其他收入来源,来补贴必应中ChatGPT的成本

而ChatGPT的背后,是金主爸爸微软,而微软拥有丰富的收入来源,目前还能支持ChatGPT这样烧下去。

但谷歌却不同,它所有的收入几乎都来自于广告。因此,如果没有广告收入,谷歌搜索引擎的价值就会大大降低。

微软2012至2022按部门划分的财年收入

更何况,搜索引擎之所以如此暴利,就是靠用户不断点击链接,在这个过程中,谷歌收取了商家巨额的广告费。

可是假如用户靠着聊天机器人能直接得到答案,而不需要在列表中翻找,搜索引擎的付费业务生态就直接被破坏了。

这个几千亿美元的蛋糕,谷歌敢冒险砸掉吗?

现在,谷歌有一条平稳过渡的出路:通过旗下的DeepMind推出商业化的聊天机器人,自己来给谷歌搜索造出一个对手(同时也是OpenAI的对手),这样一来,就可以做个对冲。

这样谷歌就可以安抚股东,当外界怀疑聊天机器人将取代搜索引擎时,也可以有个回应。

这样看,在2023年即将发布的Sparrow测试版,身上肩负的使命着实不小。

参考资料:
https://the-decoder.com/google-may-use-deepminds-sparrow-as-chatgpt-competitor/
https://the-decoder.com/deepminds-new-chatbot-is-more-helpful-correct-and-harmless/
https://time.com/6246119/demis-hassabis-deepmind-interview/



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
畅游法国(40)-敦刻尔克行OpenAI融资100亿,DeepMind急了?7 Papers & Radios | 谷歌开源机器人领域transformer;DeepMind推出剧本写作AI谷歌DeepMind宣布即将推出ChatGPT的强力竞争对手再胜OpenAI!谷歌发布20亿参数通用模型,100多种语言自动识别翻译OpenAI刚融资100亿,DeepMind急了?CEO接受《时代》专访,呼吁AI圈减少科研竞赛!别再用 if 校验参数了,太Low!这才是专业的 SpringBoot 参数校验方式!chatGPT用户突破100万!谷歌真的要完蛋了?2022,晨星舞校,秋舞芭蕾击败OpenAI!谷歌公布20亿参数通用语音模型,支持100+语种检测翻译谷歌大裁员前奏?DeepMind全面冻结实习生招聘!有人面试前1小时才收到通知ChatGPT 又遇劲敌!谷歌发布史上最大 AI 模型 PaLM-E:5620 亿参数,无需特殊训练即可操纵机器人ChatGPT 开源平替来了,开箱即用!200 亿参数,采用 4300 万条指令集微调模型谷歌报复性砸出5620亿参数大模型!比ChatGPT更恐怖,机器人都能用,学术圈已刷屏Meta版ChatGPT来了?小扎、LeCun官宣650亿参数SOTA大语言模型LLaMA谷歌真被ChatGPT搞慌了!两位创始人紧急回归制定战术,搜索广告根基不容有失DeepMind通天了!AI中期天气预报吊打全球顶级气象台:1台TPU1分钟预测10天天气OpenAI ChatGPT走红,DeepMind不甘示弱,推出剧本写作AI,一句话生成一个剧本ChatGPT 走红后 DeepMind 不甘示弱,推出剧本写作 AI,一句话生成一个剧本终结者最强大脑!谷歌发布史上最大「通才」模型PaLM-E,5620亿参数,看图说话还能操控机器人"𝙇𝙚𝙖𝙙 𝙏𝙝𝙚 𝘾𝙝𝙖𝙧𝙜𝙚"广告#创译挑战还不如GAN!谷歌、DeepMind等发文:扩散模型直接从训练集里「抄」以色列自驾游(3)地中海空中花园 - 海法Chinese Professor Suspended For Racist, Homophobic Speech最大的ViT来了!谷歌提出ViT-22B:视觉Transformer扩展到220亿参数谁发表了最具影响力的AI研究?谷歌遥遥领先,OpenAI成果转化率完胜DeepMind迷幻的玻璃艺术谷歌大模型团队并入DeepMind!誓要赶上ChatGPT进度Logitech Z506 Surround Sound Home Theater Speaker System耶鲁法学院退出《美国新闻》的排名,哈佛也跟进首个“开源ChatGPT”来了:基于谷歌5400亿参数大模型,华人小哥出品,网友吐槽:这谁能跑?chatGPT的用户突破100万,谷歌真的要完蛋了?A ChatGPT Gag Gone Wrong, a Police Probe, and a Sheepish Apology传马斯克组队开发ChatGPT替代品,招揽DeepMind大牛,对抗OpenAI
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。