Redian新闻
>
谷歌深夜放出大杀器?Gemini打爆GPT?别太浮夸!

谷歌深夜放出大杀器?Gemini打爆GPT?别太浮夸!

科技

 点击订阅,抓住风口

你好,我是王煜全,这里是王煜全要闻评论。

一年多来,谷歌一直在试图追赶OpenAI,想夺回AI领军者的宝座,最近他们发布了新的大模型,号称比GPT更强,但效果如何呢?

北京时间12月7日凌晨,谷歌官网发布了新版大模型Gemini 1.0,分为Ultra、Pro和Nano三个版本,也就是高级版、专业版、微缩版。

他们声称,Gemini专业版在八项基准测试中,有六项表现都比GPT-3.5强,其中有数学、物理、历史、法律、医学等57个科目组成的“大规模多任务语言理解测试”等等。

而且,他们还拿高级版直接和GPT-4做了对比,结果显示,它在阅读理解、代码生成等十多项比拼中都比GPT-4得分更高。

另外,谷歌还说Gemini是一种“原生的”多模态大模型,从一开始就针对文本、图像、视频、音频等不同格式的数据进行了预训练,所以在多模态表现中比GPT-4V更强。

在演示视频中,工作人员把一个纸团藏在3个纸杯中的一个下面,并打乱杯子的位置,Gemini还是成功猜中了结果。

看起来,Gemini既有评测对比,又有视频演示,还取了一个霸气的标题“欢迎来到Gemini时代”。

结果,很多媒体开始大肆宣传,有的说谷歌大杀器终于来了,有的说Gemini打爆GPT4了。但是,它真的像宣传中那么厉害吗?

实际上,号称超越GPT-4的Gemini高级版还没有正式推出,据说要等明年才会上线,所以,除了谷歌自己做的评测和演示视频之外,其他人很难验证他们的说法。

虽然现在还无法测试高级版,但是,谷歌已经把Gemini专业版植入到Bard里了。谷歌说他们专门调教了Bard,让它在理解、总结、推理、编码和规划等方面的能力更强。并且,在第三方盲测中,Bard是最受欢迎的免费聊天机器人。

要知道,今年2月份Bard刚刚发布时出了不少问题,导致谷歌股价大跌7%。现在在新模型的加持下,Bard进化到什么程度了呢?

我们提出了一个经典的老问题,“树上有10只鸟,猎人用枪打下了1只,树上还有几只鸟?”几个月前,Meta推出Llama 2的时候,我们就用这个题目测过一次。

那么,Bard是如何回答的呢?它做了一番计算,原来有10只,打掉了1只,10-1=9,所以答案是9只。

GPT-3.5是怎么回答的呢?它也说有9只,但做了补充,说枪声可能会吓跑几只,所以不确定最后剩下几只。而GPT-4直接说一只都没有,因为都被吓跑了。

看起来,Bard回答得有条不紊,还说出了推理过程,只可惜结果是错的,所以,很难说它的文字理解能力已经超过了GPT-3.5,更别说GPT-4了。

除此之外,谷歌宣传Gemini是“原生”多模态大模型,那么咱们就测试一下它的看图能力吧。

我们发给它一张有8片树叶的图片,问图中有几个物体。结果,Bard回答说有5片树叶,它还贴心地从网上另外找了一张树叶图片,问题是,它找的图片里也不只有5片叶子。这样的图像理解能力实在称不上强大。

因为默认的GPT-3.5还没有看图功能,我们就把图片发给GPT-4了,结果它很干脆地说出了正确答案。


其实,国内外很多厂商在推出大模型产品的时候,都会对标GPT。虽然很少有人声称比GPT-4强,但有不少人说自己的模型超越GPT-3.5了,还会搬出各种测试跑分结果。

不过,很多测试都是基于已有数据集的测试,相当于有题库的考试,也就是说,测试分高不一定代表实际体验更好,而可能只是这类的训练做得多。所以,现在就说Gemini已经打爆GPT-4,还为时尚早。

其实技术是否领先没有外界想得那么重要。更重要的是,GPT-3.5是去年发布的,GPT-4是今年3月发布的,他们成功吸引到了大量用户,帮助自己完善了产品。现在,在技术初步成熟之后,发布了GPT Store的OpenAI已经开始进入商业化、生态化探索阶段了。

他们不只把GPT深度植入在微软全家桶服务中,还推出了客户定制版的GPTs功能,据统计,现在已经有34000多个GPTs工具了。这些动作的本质目的都是抓住用户,吸纳更多的数据,也就能够更快地迭代模型。

相比之下,谷歌还处于技术跟随阶段,在商业化模式方面还没有在突破性进展。谷歌向来就是以技术为核心的公司,商业化一直是弱项,Bard又缺少GPT那样的用户基础和微软生态,缺乏足够的用户反馈,单纯的技术跟随很难实现超越。

现在虽然谷歌自己主张Gemini赶上了GPT-4,但是,Sam Altman也说过GPT-5已经在开发中了,到时候谷歌依然会落后,依然在追赶。

当然,谷歌也并非没有反超的可能,他们也有一个巨大的用户入口,那就是谷歌搜索。如果他们能下决心用大模型重构谷歌搜索,而不是只植入一个Bard功能,就能用搜索的巨大流量帮助自己快速完善产品,那倒真有机会实现赶超。

但是,谷歌早已不是当初那个挑战雅虎的初创公司了,无论是对收入利润等经营业绩的考量还是基于领导层的决策风险,都不敢轻易颠覆谷歌搜索这样带来公司主要现金流的的支柱业务。而且,谷歌的公司治理结构就不支持这种壮士断腕式的举措。

但另一边,随着人工智能、短视频等新技术的发展,人们获取信息的渠道正在发生变化。有不少人用GPT加联网功能来搜索,汇总起来也更方便,另外,根据皮尤研究中心的调查,30岁以下的美国人中,有三分之一都在Tik Tok上获取新闻,所以,传统搜索引擎很可能面临“温水煮青蛙”的局面。未来谷歌搜索的流量会缓慢下滑。

与之相比,微软却快速意识到了危机,即使把自己的核心业务与另一家公司绑定,也要对自己的核心产品做AI转型。

也就是说,微软对产业趋势的洞察更加前瞻,也敢于做大刀阔斧的变革,而谷歌还沉浸在重夺技术宝座的征途中,他们的前景很可能有巨大的差别。

谷歌和微软都是相对成熟的企业,但现在成熟企业也经常会面临技术升级带来的两难选择:到底是主动放弃盈利业务去找死,还是维持现状看着技术过时业务消退地等死。微软在公司治理结构上的安排使他们巧妙地避免了这个两难选择。

下周的科技特训营课程中,我们就会分析微软、谷歌、Meta等大型科技巨头的发展状况与前景,并深入剖析微软是如何走出技术革命的两难困境的。感兴趣的朋友扫描下方课程海报中的二维码,报名加入吧。

以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!

王煜全要闻评论,我们下周见!


我们还整理了一份”A16Z:50个AI web产品榜单”清辛苦你点下“赞”和“在看”,点击顶部的“进入公众号”,在对话框里发送“科技”二字,你就会获得这份清单。
清单每天更新,所以请跟上全球风口的节奏;如果想要所有行业清单,扫码加入科技特训营,分分钟尽在掌握!

【科技特训营】全新的会员订阅制线上书院模式,全年50次“在线直播课程+私享群互动”,你随时可以加入、我持续保持更新!一起互动,伴随成长!让我们为未来五年做好准备,一起探讨把握机遇,决胜未来!


回放地址
长按扫描二维码加入科技特训营,可观看所有直播和回放。

1. 前哨科技特训营直播课程第四季(2023年)共50讲+,除此之外还有5节加餐+公开课。
2. 每讲承诺为1小时视频内容,实际平均时长为2小时。
3. 每周四晚八点准时直播,会员可无限次观看回放。
4. 新入会员,可以无限次回看之前所有视频课程。
5. 成为会员即可使用【AI王煜全】,最新AI大模型开发的专属科技分析助手
6. 每周组织【前哨·创新启发局】,链接科技/产业一线人士,打开技术/应用前沿视野
7. 优先获取全球科技产业一线游学、访问机会,接触科技/产业专家,获取最新、最前沿的趋势洞察,人脉链接
8. 本课程为虚拟内容服务,年费订阅服务制。一经订阅概不退款,线下活动需另行支付差旅成本,请您理解。

课程咨询】
请加“创新地图助手”:
微信:innovationmapSM

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
碾压GPT4,超越人类?谷歌Gemini 6分钟互动视频来了重磅!哈马斯亮出一款超级大杀器,以色列后方面临毁灭性打击【社会】知名二手平台竟暗藏贩卖儿童的勾当?别太离谱又一个女孩被逼和解?别太离谱超卷一夜!AMD、谷歌纷纷亮出大杀器,剑指何方? |【经纬低调分享】1500名敢死队员全部阵亡,哈马斯手里还有一个大杀器!了解你的系统和数据库、两天能升级上千Java应用!生成式AI大杀器Amazon Q 才是开发专家?谷歌深夜放大招!最强大模型Gemini能打败GPT4吗?ChatGPT网页版出现重大Bug;传谷歌Gemini推迟至明年发;荣耀将推自研端侧大模型丨AIGC大事日报Lululemon半夜放大招,悄悄打折+补货,我下了一单又一单...第四章 牛刀初试优等生归来,谷歌最强大模型Gemini能否打败GPT4?|甲子光年Redis大杀器,深入剖析,从简入深Redis大杀器!测评数据超越GPT-4,谷歌推出全新AI模型Gemini去年这个时候都没这么便宜呢?!秋冬有了这个大杀器幸福感爆棚!突发!谷歌发布史上最强大模型Gemini,赶超GPT-4|亮马桥小纪严选探寻西西里与马耳他的历史脚印(17)在热搜庆祝她守寡?别太恶毒了谷歌AI大模型Gemini亮相:擅长复杂学科推理,能懂编程语言 PK GPT-4小米麋鹿测试成绩全球前十?别太把这事放在心上。《移居蒙城20周年》语言理解首超人类,谷歌最新大模型Gemini,碾压GPT-4谷歌深夜放复仇杀器Gemini,最强原生多模态史诗级碾压GPT-4!语言理解首超人类谷歌AI通过图灵测试,大模型医生来了?GPT-4竟诊断出难倒17个医生的怪病公元2123年(7)超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!谷歌深夜放杀器Gemini,最强原生多模态碾压GPT-4?突发!谷歌深夜掀桌子,发最强大模型Gemini,跑分碾压GPT-4【附60页技术报告】别漏了!Lululemon半夜放大招,悄悄打折+补货...Lululemon半夜放大招,悄悄打折+补货,晚了就没了...探寻西西里与马耳他的历史脚印(18)火了半年整天吊打别人的GPT-4,今天碰到个头铁的被吊打, 谷歌发布史上最强大模型Gemini微软深夜放大招:GPT-4 、DALL·E 3、GPTs免费用,自研大模型专用AI芯片拆解谷歌Gemini :能力可与GPT-4“掰手腕” 目前可免费使用
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。