Redian新闻
>
测评数据超越GPT-4,谷歌推出全新AI模型Gemini

测评数据超越GPT-4,谷歌推出全新AI模型Gemini

公众号新闻

谷歌打响AI模型反击战。

北京时间12月7日凌晨,谷歌宣布推出其“最通用、功能最强大”的新大型语言模型Gemini 1.0。

据介绍,针对不同场景,Gemini 1.0包含三个版本:适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro和适用于手机等端侧设备的Gemini Nano。

在模型架构方面,Gemini 1.0采用Transformer架构,采用高效的Attention机制,支持32K的上下文长度。此外,该模型具有复杂多模态推理能力,可以同时识别文本、图像、音频、视频和代码五种信息。它能够发现大量数据中难以辨别的知识,因此能够更好地理解微妙的信息,并回答复杂的问题。这使得它特别擅长解释数学和物理等复杂学科的推理。

例如,Gemini 能够独立批改物理作业,在正确“读懂”题目、识别凌乱手写笔迹的同时,指出学生在解题过程中的错误,并给出正确答题步骤。通过图像和语音输入,Gemini可以指导做菜,并在不同阶段提出相应的建议。

在编码能力上,Gemini可以理解、解释和生成世界上最流行的编程语言(如Python、Java、C++和Go)的高质量代码。同时,Gemini还可以用作更高级编码系统的引擎。

谷歌声称,Gemini Ultra以90.0%得分成为第一个在MMLU(大规模多任务语言理解)测试中超过人类专家的模型。记者了解到,MMLU是一个结合了数学、物理、历史、法律、医学和伦理学等57个科目的测试集,用于测试世界知识和解决问题的能力。相比于其他测试集,MMLU的广泛性和深度更强,特别是测试大模型在复杂和多变的真实世界场景中的表现。

“Gemini是我们最强大的模型。通过吸收大量的信息,它可以理解我们四周的环境,理解我们的思维方式,并有所产出。”谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)介绍说。

同时,他也正面谈及Gemini与GPT-4的对比。“我们运行了32个完善的基准测试来比较Gemini和GPT-4,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。我认为我们在32项基准中的30项中大幅领先。”哈萨比斯说。

在Gemini发布之前,谷歌在生成式AI和LLM方面主推的两款模型PaLM 2和LaMDA,在用户当中收获的评价一直不高,相对于业界领军的GPT-4差距很大。Gemini的发布,标志着谷歌迈进新纪元的开始。

目前,Gemini Pro和Gemini Nano可开始应用于在聊天机器人Bard和智能手机Pixel 8 Pro中,并将很快与谷歌服务中的其他产品集成,包括Chrome、搜索和广告等。最强大的Gemini Ultra则将在明年发布。

延伸阅读:
小米也“骑墙”?电动汽车电池路线之争再生悬念
运营商小试大模型,“1+N”模式浮出水面


作者丨张维佳
编辑丨赵晨
美编丨马利亚
监制丨连晓东

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
聊聊我心中浩气长存的《黑道家族》 ? 世间再无Tony Soprano突发!谷歌深夜掀桌子,发最强大模型Gemini,跑分碾压GPT-4【附60页技术报告】王小川旗下百川智能千亿大模型Baichuan 3,中文评测超越GPT-4;美国启动国家AI计划推动开放式AI研究丨AIGC日报碾压GPT4,超越人类?谷歌Gemini 6分钟互动视频来了谷歌深夜放大招!最强大模型Gemini能打败GPT4吗?智谱AI推出新一代基座模型GLM-4,发起大模型开源基金移民生活(26)由聂树斌案谈到严打突发!谷歌发布史上最强大模型Gemini,赶超GPT-4|亮马桥小纪严选懒人花园:由古埃及铃铛想到的全球首个开源多模态医疗基础模型:人工打分平均超越GPT-4V、支持2D/3D放射影像摧残毁灭潘汉年和关露的那些人想隐瞒的究竟是一段什么惊天的历史大秘密?实测谷歌大模型Gemini:评价与自我评价AI早知道|知网推出AI写作选题;智谱AI发布大模型GLM-4;华为开源GenImage数据集AI大乱斗格局凸显,谷歌推出全新AI模型Gemini | 科技趣评效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜震惊!!!谷歌发布最强多模态大模型Gemini姚让的疫情时代(4)真我GT5 Pro发布;谷歌推出AI模型Gemini;春晚吉祥物龙辰辰被质疑AI合成优等生归来,谷歌最强大模型Gemini能否打败GPT4?|甲子光年比亚迪悬赏 500 万打击恶意抹黑;谷歌推迟 Gemini 发布时间;腾讯视频崩了,官方紧急回应 | 极客早知道用AI评估AI,上交大新款大模型部分任务超越GPT-4,模型数据都开源语言理解首超人类,谷歌最新大模型Gemini,碾压GPT-4火了半年整天吊打别人的GPT-4,今天碰到个头铁的被吊打, 谷歌发布史上最强大模型Gemini代码能力超越GPT-4,这个模型登顶Big Code排行榜,YC创始人点赞智谱 AI 推出新一代基座大模型 GLM-4,能力逼近 GPT-4,配备多模态、长文本和智能体超越GPT-4,Google发布大模型Gemini/苹果明年初或将推出多款新品/五月天阿信回应假唱风波百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4谷歌AI大模型Gemini亮相:擅长复杂学科推理,能懂编程语言 PK GPT-4谷歌推出AI模型Gemini;老凤祥x野兽派推出足金车载香氛;Prada目标将中国业务翻倍... | 刀法品牌热讯超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!谷歌最强AI大模型Gemini 1.0发布;Touch ID发明人宣布退休;麦当劳中国APP启动鸿蒙原生应用开发|AIoT情报工信部发AI产业建设指南草案;小米申请注册大模型商标;谷歌推出画圈搜索功能丨AIGC大事日报新MacBook Air或明年春季推出/Google发布Gemini大模型,多领域超越GPT-4/微软Copilot重磅升级OpenAI推出Vision Pro版ChatGPT;消息称谷歌将把Bard更名为Gemini,并推出独立应用丨AIGC日报讯飞星火:整体超越ChatGPT,医疗超越GPT4!一手实测在此
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。