Redian新闻
>
震惊!!!谷歌发布最强多模态大模型Gemini

震惊!!!谷歌发布最强多模态大模型Gemini

科技

本文首发微信公众号:飞总聊IT

谷歌CEO劈柴今天官宣了谷歌的最新多模态大模型Gemini 1.0版本正式上线。



Gemini是谷歌最牛逼的大模型,它有三种量级:Gemini Ultra, Gemini Pro以及Gemini Nano。顾名思义,最后一个应该是可以在手机端本地运行的模型。


Gemini多强呢?下面这段谷歌公布的演示视频展示了谷歌公布的Gemini到底有多强:


视频里,演示者以浓郁的印度口音给大家展示了这个多模态大模型可以识别视频的能力,叹为观止。


谷歌的Bard聊天机器人,也已经升级到了Gemini,按理来说,应该也表现出了类似的能力。我测试了一下,但是我个人的感觉变化并不是很明显。


也许还需要时间rollout,才能够让大家都看到Bard的变化。


Gemini这个模型的推出,今年5月份在Google I/O上就可以开始放风了,但是谷歌实际推出的时间一拖再拖。具体原因是什么,众说纷纭。


为了和OpenAI与微软合体展开竞争,谷歌今年果断的决定从自己的PaLM 2切换到Gemini上。为了让Gemini成功,谷歌还把两大人工智能研究机构Google Brain和DeepMind合并在了一起。


这个Gemini就是集合了谷歌两大顶尖人工智能研究机构的产物。从发布的情况来看,Gemini在各种各样的Benchmark中都拿到了最优秀的成绩。


而Gemini到底能干什么事情不能干什么事情,谷歌的产品副总裁Eli Collins表示,谷歌依然在努力研究,毕竟大模型就像黑盒子,人类要懂得大模型能做什么不能做什么还是很困难的。


但是不管怎么样,单纯从参数量来看,Gemini显然已经大大超越了目前的GPT 4,而从谷歌披露的演示视频来看,这个演示视频显然也让人很吃惊。


至少我看演示视频的时候,我觉得非常的夸张。即使ChatGPT已经一次又一次的吓着我了,Gemini的表现还是再一次吓到我了。


一个AI怎么可能有如此牛逼的辨别能力和信息处理能力呢?如果那个确实是AI的话,那么通用人工智能离我的距离,可能比我们想象的还要近很多。


但是话说回来了,谷歌做Demo,也可能就是Demo,毕竟,我们也都知道,如果谷歌只是为了让Demo好看的话,也不是很困难的事情。而且谷歌在Demo上的黑历史也不仅仅是一次了。


因此,到底Gemini是有多牛逼,是真牛逼,还是假牛逼,我们还需要再耐心等待一段时间,毕竟,是骡子是马,最后总是能够在遛遛的过程中现出原形的。


市场期盼另外一个大模型已经很久了,不是说开源的大模型不行,也不是说其他公司没有大模型,但是没有一个抗打的。如果OpenAI的GPT 4是大学生水平的话,其他几个撑死了小学生水平,差距实在太大了。


我本人也对谷歌期望满满,我买了不少谷歌股票,就指望着谷歌在人工智能方面大展宏图,顺便带动我小小的赚一点。


我建了个星球,聚焦讨论职场发展和裁员应对的问题,有兴趣的朋友可以加入,向我提问,和我一起讨论这方面的问题。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
思谋进博会首秀:发布全球首个工业多模态大模型,现场与松下、江森自控签署全面战略合作再读席慕容的诗阿里云中标9亿AI算力大单;浙大校友开源LLaVA-1.5多模态大模型;Meta因开源模型遭抗议丨AIGC大事日报腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法碾压GPT-4?谷歌发布最强AI模型,解读来了谷歌发布Gemini,负责人:原生多模态大模型是AI「新品种」,正探索与机器人结合于向真:湖南之行AI搞定谷歌验证码,最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队早晨空腹游泳好吗?清华团队攻破GPT-4V、谷歌Bard等模型,商用多模态大模型也脆弱?实测谷歌大模型Gemini:评价与自我评价谷歌深夜放杀器Gemini,最强原生多模态碾压GPT-4?首创pix2emb范式!NUS清华联合发布NExT-Chat:对话/检测/分割全能多模态大模型超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!清华大学与智谱 AI 联合推出 CogAgent:基于多模态大模型的 GUI Agent,具备视觉问答、视觉定位等能力谷歌深夜放大招!最强大模型Gemini能打败GPT4吗?大模型+自动驾驶=?普渡大学等最新《自动驾驶领域多模态大型语言模型》综述火了半年整天吊打别人的GPT-4,今天碰到个头铁的被吊打, 谷歌发布史上最强大模型Gemini突发!谷歌深夜掀桌子,发最强大模型Gemini,跑分碾压GPT-4【附60页技术报告】UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源学术成果 | EMNLP2023:MMEdit——如何编辑多模态大语言模型?​AAAI 2024 | 首个多模态实体集扩展数据集MESED和多模态模型MultiExpan谷歌最强AI大模型Gemini 1.0发布;Touch ID发明人宣布退休;麦当劳中国APP启动鸿蒙原生应用开发|AIoT情报谷歌AI大模型Gemini亮相:擅长复杂学科推理,能懂编程语言 PK GPT-4横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%谷歌深夜放复仇杀器Gemini,最强原生多模态史诗级碾压GPT-4!语言理解首超人类理想汽车发布史上最大更新:多模态大模型首次上车,无人泊车即将推送语言理解首超人类,谷歌最新大模型Gemini,碾压GPT-4小说:兰欣与乌茶 34GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评假山假水愈真情突发!谷歌发布史上最强大模型Gemini,赶超GPT-4|亮马桥小纪严选优等生归来,谷歌最强大模型Gemini能否打败GPT4?|甲子光年将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7BAI早知道|ChatGPT模型大更新;阿里云发布多模态大模型;百度推多模态模型UNIMO-G
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。