Redian新闻
>
反击OpenAI,谷歌放出最强悍大模型Gemini

反击OpenAI,谷歌放出最强悍大模型Gemini

科技新闻

OpenAI空前崛起之际,谷歌毅然打响了绝地反击战。
北京时间12月7日凌晨,谷歌CEO桑达尔.皮查伊和Deepmind
CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini
1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。
Gemini
1.0是谷歌筹备了一年之久的GPT4真正竞品,也是目前谷歌能拿出手的功能最为强悍、适配最为灵活的大模型,包括三种不同套件,分别是Gemini
Ultra, Gemini Pro和Gemini
Nano。其中Ultra的能力最强,复杂度最高,能够处理最为困难的多模态任务;Pro能力稍弱,是一个可扩展至多任务的模型;Nano则是一款可以在手机端侧运行的模型。这说明,Gemini的触达范围很广,可以下探至数据中心,也可以上行至移动设备端侧。
谷歌的Bard聊天机器人,此番也已经升级到了Gemini,可以说Gemini的初始版本已于今日开始在Bard中提供。从5月的I/O大会之后,谷歌就将自己此前最强的人工智能模型PaLm
2融入了Gemini的能力之中。
在一段公布的演示视频中,桑达尔.皮查伊展示了Gemini对视频、图像的非同凡响的识别能力。在视频中,Gemini极为自如地在图像、音频、视频各模态之间的转换,展现了惊人的解锁应用场景与产品形态的潜力。

仅从谷歌释出的演示视频结果看,市面上现有的全部多模态大模型与Gemini的性能表现都有代际差,包括Meta
5月开源的跨6个模态的AI模型ImageBind以及GPT-4。

今年4月开始,随着多模态技术不断升级,以及叠加模型调用成本等性能的优化,GPT4及国内外一众模型持续迭代,实现了跨模态性能的不断增强。一时间,多模态大模型呈百花齐放之势。但有国内头部大模型初创开发工程师对界面新闻记者表示,现今绝大部分多模态大模型都是在大语言模型LLM之上生长出多模态的应用,而并非从头开始训练的多模态的大模型,这是多模态大模型目前“不能言说的秘密”。

谷歌自己也提到,到目前为止,创建多模态模型的标准方法基本是针对不同模态训练单独的组件,然后将它们拼接以粗略模仿其中一些功能。这会导致这些模型有时擅长执行某些任务,例如描述图像,但难以处理更概念性和复杂的推理。
其通过60页的相关技术报告证明,Gemini是一个真正原生的多模态大模型,因为从最初的预训练数据开始,Gemini就在针对不同模态的模型进行训练,因此其功能在每个重大领域都达到了SOTA(State
of the art,特指领先水平的大模型)。

在权威MMMU基准测试中,Gemini
Ultra获得了59.4%的SOTA分数。这项基准测试是经典的多模态测试,由跨不同领域的多模式任务组成,能够体现大模型的深度推理能力,而推理过程本身,需要花费的成本要远远高于模型训练。谷歌技术报告同时显示,谷歌是使用TPUv5e和TPUv4来训练Gemini,尤其是训练Gemini
Ultra时,使用了跨多个数据中心的大量TPUv4。
多模态能力之外,Gemini在专业知识储备和高级编码等领域都处在最前列。比如,Gemini
Ultra在MMLU(大规模多任务语言理解数据集)中的得分率高达90.0%,这款MMLU数据集包含数学、物理、历史、法律、医学和伦理等57个科目,专门用于测试大模型的知识储备和解决问题能力。Gemini
Ultra是第一个在MMLU上超越人类专家的大模型。
值得一提的是,谷歌此番并没有透露Ultra和Pro版本的具体参数规模,但根据量子位的分析,Gemini与谷歌此前的主力大模型PaLM-2相比,参数规模上要增大许多。此前,PaLM-2被曝参数规模为3400亿。
谷歌方面表示,Gemini将通过谷歌产品推向数十亿用户。从12月13日开始,开发者和企业客户可以通过Google AI
Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。
今天凌晨,谷歌还同步发布了最新版本的计算芯片TPU v5p,相较上一代TPU
v4性价比提升2.3倍,但这则消息完全被Gemini的光芒所掩盖。

戳这里提交新闻线索和高质量文章给我们。
来源: wenxuecity
相关阅读
大模型中文内容安全评测发布,幻方DeepSeek-67B模型夺魁,谷歌7B模型表现亮眼美国可能强制谷歌放弃安卓系统通胀回落点燃降息预期,谷歌Gemini AI重磅登场直击苹果谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o开源Llama 3.1一夜成最强大模型!超越闭源GPT-4o,OpenAI坐不住了iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑奥特曼进军搜索,谷歌慌了!让谷歌股价暴跌的“大杀器”三个月前就被程序员摸透了!OpenDevin出技术报告了,大模型Agent开发者必读大模型高考成绩公布,理科最多上「二本」/传娃哈哈总经理宗馥莉请辞/OpenAI 推出 GPT-4o mini 新模型翻车了!9.11和9.9哪个大?实测12个大模型8个都答错;OpenAI开打价格战,新模型价格骤降96%-97%丨AI周报成本降低10万倍!生成一周大气模拟仅需9.2秒,谷歌气候模型登Nature谷歌 Gemma 2 2B 发布火爆,小模型如何撑起大格局?最强智能体Agent Q发布!Llama 3成功率飙升3倍,OpenAI神秘「草莓」遭截胡?最强数学大模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”科学家提出大模型微调新方法,效果优于现有大模型参数高效微调通义大模型成巴黎奥运会首个AI大模型应用技术提供方;保时捷CEO:接受中国销量下降,不会加入价格战....今日arXiv最热大模型论文:北京大学最新综述:视觉大模型中的漏洞与攻防对抗大模型时代的操作系统:融合Rust和大模型,vivo打造AI操作系统前瞻产业研究院&华为云:2024年中国AI大模型场景探索及产业应用调研报告-大模型“引爆”行业新一轮变革如何把商业交给大模型?京东科技何晓冬:需要更严肃地把大模型“幻觉率”降下来
原创公众号
小孩姐自创的游戏震惊到我了分享一个很装但有效的“要面子学习法”别忘了,AI也会污染环境你听了那么多职业建议,最有用的是什么?保存微信聊天记录?这个方法有点东西!终于明白微信的良苦用心了!你有遇到过大数据杀熟吗?Franklin Templeton,开始发放Full Time Associate面试offerData Analyst重量级证书!德勤官方:3小时拿证,零门槛赤裸真相!大批留学生放弃加拿大,回国!重要!这些美国大学「2025Fall」早申有调整!含杜克、UC系、CMU……上市奖励叫停?多地回应!已婚女性不能组装iPhone?富士康回应!Z世代老板,有什么?缺什么?爱什么?怕什么?丨来点财经范儿用最快速度完成早餐KPI,全靠它上分!天津人和山东人都愣住了快手同城有多少战地记者1.8万亿的快手,跌光1.6万亿低利率时代如何才能不被掠夺?中植死于关系网和内部腐败中国人消费力为何骤降?有一个原因你可能想不到第一次干这事儿,竟然还有点紧张!我和老公是拼婚,他却骂我是疯子,生了一个傻子!佩霞与情夫,将“反腐”推向了新高度!6亿身家董宇辉,局势不妙。币安研究院:下半年值得关注的六大主题燃炸!澳洲偏远大学斩下24枚奥运奖牌!一个大学超越多个国家,媲美斯坦福!背后原因,今天曝光了...看完或许不意外...曝拖欠数十名tradie工钱,澳华人老板资产遭冻结,公司进入清算程序!汪小菲情绪再失控!大闹餐厅!引诱未成年男生在教室发生性关系,发送大尺度视频!澳洲中学女老师再次被捕悉尼新地铁线今晨正式迎客!站台挤满通勤者,有人为搭首班列车一夜不眠
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。