Redian新闻
>
反击OpenAI,谷歌放出最强悍大模型Gemini

反击OpenAI,谷歌放出最强悍大模型Gemini

科技新闻

OpenAI空前崛起之际,谷歌毅然打响了绝地反击战。
北京时间12月7日凌晨,谷歌CEO桑达尔.皮查伊和Deepmind
CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini
1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。
Gemini
1.0是谷歌筹备了一年之久的GPT4真正竞品,也是目前谷歌能拿出手的功能最为强悍、适配最为灵活的大模型,包括三种不同套件,分别是Gemini
Ultra, Gemini Pro和Gemini
Nano。其中Ultra的能力最强,复杂度最高,能够处理最为困难的多模态任务;Pro能力稍弱,是一个可扩展至多任务的模型;Nano则是一款可以在手机端侧运行的模型。这说明,Gemini的触达范围很广,可以下探至数据中心,也可以上行至移动设备端侧。
谷歌的Bard聊天机器人,此番也已经升级到了Gemini,可以说Gemini的初始版本已于今日开始在Bard中提供。从5月的I/O大会之后,谷歌就将自己此前最强的人工智能模型PaLm
2融入了Gemini的能力之中。
在一段公布的演示视频中,桑达尔.皮查伊展示了Gemini对视频、图像的非同凡响的识别能力。在视频中,Gemini极为自如地在图像、音频、视频各模态之间的转换,展现了惊人的解锁应用场景与产品形态的潜力。

仅从谷歌释出的演示视频结果看,市面上现有的全部多模态大模型与Gemini的性能表现都有代际差,包括Meta
5月开源的跨6个模态的AI模型ImageBind以及GPT-4。

今年4月开始,随着多模态技术不断升级,以及叠加模型调用成本等性能的优化,GPT4及国内外一众模型持续迭代,实现了跨模态性能的不断增强。一时间,多模态大模型呈百花齐放之势。但有国内头部大模型初创开发工程师对界面新闻记者表示,现今绝大部分多模态大模型都是在大语言模型LLM之上生长出多模态的应用,而并非从头开始训练的多模态的大模型,这是多模态大模型目前“不能言说的秘密”。

谷歌自己也提到,到目前为止,创建多模态模型的标准方法基本是针对不同模态训练单独的组件,然后将它们拼接以粗略模仿其中一些功能。这会导致这些模型有时擅长执行某些任务,例如描述图像,但难以处理更概念性和复杂的推理。
其通过60页的相关技术报告证明,Gemini是一个真正原生的多模态大模型,因为从最初的预训练数据开始,Gemini就在针对不同模态的模型进行训练,因此其功能在每个重大领域都达到了SOTA(State
of the art,特指领先水平的大模型)。

在权威MMMU基准测试中,Gemini
Ultra获得了59.4%的SOTA分数。这项基准测试是经典的多模态测试,由跨不同领域的多模式任务组成,能够体现大模型的深度推理能力,而推理过程本身,需要花费的成本要远远高于模型训练。谷歌技术报告同时显示,谷歌是使用TPUv5e和TPUv4来训练Gemini,尤其是训练Gemini
Ultra时,使用了跨多个数据中心的大量TPUv4。
多模态能力之外,Gemini在专业知识储备和高级编码等领域都处在最前列。比如,Gemini
Ultra在MMLU(大规模多任务语言理解数据集)中的得分率高达90.0%,这款MMLU数据集包含数学、物理、历史、法律、医学和伦理等57个科目,专门用于测试大模型的知识储备和解决问题能力。Gemini
Ultra是第一个在MMLU上超越人类专家的大模型。
值得一提的是,谷歌此番并没有透露Ultra和Pro版本的具体参数规模,但根据量子位的分析,Gemini与谷歌此前的主力大模型PaLM-2相比,参数规模上要增大许多。此前,PaLM-2被曝参数规模为3400亿。
谷歌方面表示,Gemini将通过谷歌产品推向数十亿用户。从12月13日开始,开发者和企业客户可以通过Google AI
Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。
今天凌晨,谷歌还同步发布了最新版本的计算芯片TPU v5p,相较上一代TPU
v4性价比提升2.3倍,但这则消息完全被Gemini的光芒所掩盖。

戳这里提交新闻线索和高质量文章给我们。
来源: wenxuecity
相关阅读
AI搜索引擎来了!谷歌放大招,发布最强AI模型,语音功能正面刚OpenAI谷歌放大招,AI搜索引擎来了,发布最强AI模型!发布会现场:总共提了120次AI、视频模型登场......发布会对比惨烈,奥特曼发文暗讽谷歌!谷歌被曝疯狂重组迎击OpenAIOpenAI再压谷歌一头,最强模型GPT-4o免费发布,语言对话媲美人类反应扎克伯格出手狙击OpenAI,大模型竞赛再升级OpenAI发布新旗舰模型GPT-4o;字节跳动正式发布豆包大模型|AIGC周观察第四十三期单张A100全精度推理!谷歌明星开源模型Gemma 2上新9B/27B,挑战3140亿Grok-1谷歌回击OpenAI!OpenAI奇袭,谷歌反击大模型中文内容安全评测发布,幻方DeepSeek-67B模型夺魁,谷歌7B模型表现亮眼这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单未央播报 | 央行进一步推动优化支付服务工作 OpenAI发布多模态大模型GPT-4o神秘模型gpt2-chatbot实力被赞超越GPT-4:sam亲自确认,或是OpenAI全新模型发布屡次截胡?OpenAI与谷歌携新版大模型再度交锋 | 大模型一周大事多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」昇腾社区回应网传华为发布会大模型生成图片系人工操控;Sam Altman:新款语音模型GPT-4o尚未发货丨AIGC日报5亿参数“小模型”如何超越千亿级参数大模型GPT-3.5?OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折OpenAI发布全新模型GPT-4o;麦当劳回应使用过期食材;王化回应小米 SU7 刹车故障;璩静离职后发声...
原创公众号
女到中年,别再吃保守的亏了一家中国企业造「天花板防晒服」,全球33国认证!UPF600+,有满减有赠品!让美国礼崩乐坏的“觉醒病毒”,是怎么滋长出来的?渡十娘|万斯“无孩猫女”论恐犯众怒,霉霉粉丝奋起反击加币崩盘创一年新低!加拿大央行宣布连续降息!今年还要来三次?!特鲁多急了!触目惊心!加拿大国宝小镇被一夜烧毁,沦为废墟!省长面对惨状几度哽咽...大反转!失踪华裔少女的父亲被逮捕,涉嫌绑架儿童……美国大学申请规划:哪些美国高中藤校录取率最高刷屏!巴黎奥运会开幕式登场,主火炬竟飞到了天上,但旗帜挂反了……小黄人偷走了《蒙娜丽莎》,贾玲也上了红毯Amex Business Gold 商业“信用卡”【200k 开卡奖励】免中介费和9月租金|9.1入住|接本科生|室内洗烘|50 Leo近哈佛商学院/BU新建高级公寓studio 租金折后2929+8.1或9.1起租|77平超大空间|21楼景观好|接本科|带家具|市中心超近MGH|近地铁高级公寓1B1B租金2800,包水暖无中介费|9.1入住|走路10分钟到BU 优质两室一厅3000,包供暖和热水!绝对贫困与相对贫困,许善达“4000元说”是简单粗暴,还是被误读?【惠宜美高】恭喜惠宜学子补录顶级美高Emma Willard School!15刀以内?!从Midland&Finch吃到Midland&Steeles,穷鬼套餐在这里黑毛猪猪蹄hin绝‼️多伦多私藏黑毛猪专卖店周末好去处、开仓优惠和景点优惠门票(2024.7.26-7.28)【精选】薰衣草花田合集、Richmond Hill好去处、$20看棒球攻略……我7岁的好大儿,终于知道搞钱了!人民日报|杨斌、周庆安:以文化为重要支点推动高质量发展突发!蒙市华裔少女失踪案最新后续:其父涉嫌诱拐儿童等被捕万博士教育讲座:美高11年级 12年级如何准备大学申请策略价值9位数!全球Top 1咨询公司内部645页Case手册曝光八大投行!恭喜UChicago学员斩获J.P.Morgan 2025暑期实习Offer美国名企内推|NVIDIA正在招聘Research Scientist(2024 Fall)Science:这股神秘的强大力量,正在影响巴黎奥运成绩!包括空调。。。【Hanson学术】中国医(学)生赴美行医之三:考U后实习、推荐信、文书JAMA:美国医生短缺1/4,每年近万国际生受招赴美行医;中国医(学)生的好机会!太震撼!巴黎奥运会开幕式创造历史!浪漫、自由、平等、疯狂、热烈!整个巴黎都是舞台!太多惊喜...
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。