测评数据超越GPT-4，谷歌推出全新AI模型Gemini

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>公众号

公众号新闻

2023-12-07 08:12

谷歌打响AI模型反击战。

北京时间12月7日凌晨，谷歌宣布推出其“最通用、功能最强大”的新大型语言模型Gemini 1.0。

据介绍，针对不同场景，Gemini 1.0包含三个版本：适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro和适用于手机等端侧设备的Gemini Nano。

在模型架构方面，Gemini 1.0采用Transformer架构，采用高效的Attention机制，支持32K的上下文长度。此外，该模型具有复杂多模态推理能力，可以同时识别文本、图像、音频、视频和代码五种信息。它能够发现大量数据中难以辨别的知识，因此能够更好地理解微妙的信息，并回答复杂的问题。这使得它特别擅长解释数学和物理等复杂学科的推理。

例如，Gemini 能够独立批改物理作业，在正确“读懂”题目、识别凌乱手写笔迹的同时，指出学生在解题过程中的错误，并给出正确答题步骤。通过图像和语音输入，Gemini可以指导做菜，并在不同阶段提出相应的建议。

在编码能力上，Gemini可以理解、解释和生成世界上最流行的编程语言（如Python、Java、C++和Go）的高质量代码。同时，Gemini还可以用作更高级编码系统的引擎。

谷歌声称，Gemini Ultra以90.0%得分成为第一个在MMLU（大规模多任务语言理解）测试中超过人类专家的模型。记者了解到，MMLU是一个结合了数学、物理、历史、法律、医学和伦理学等57个科目的测试集，用于测试世界知识和解决问题的能力。相比于其他测试集，MMLU的广泛性和深度更强，特别是测试大模型在复杂和多变的真实世界场景中的表现。

“Gemini是我们最强大的模型。通过吸收大量的信息，它可以理解我们四周的环境，理解我们的思维方式，并有所产出。”谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯（Demis Hassabis）介绍说。

同时，他也正面谈及Gemini与GPT-4的对比。“我们运行了32个完善的基准测试来比较Gemini和GPT-4，从广泛的整体测试（如多任务语言理解基准测试）到比较两个模型生成Python代码的能力。我认为我们在32项基准中的30项中大幅领先。”哈萨比斯说。

在Gemini发布之前，谷歌在生成式AI和LLM方面主推的两款模型PaLM 2和LaMDA，在用户当中收获的评价一直不高，相对于业界领军的GPT-4差距很大。Gemini的发布，标志着谷歌迈进新纪元的开始。

目前，Gemini Pro和Gemini Nano可开始应用于在聊天机器人Bard和智能手机Pixel 8 Pro中，并将很快与谷歌服务中的其他产品集成，包括Chrome、搜索和广告等。最强大的Gemini Ultra则将在明年发布。

延伸阅读：

小米也“骑墙”？电动汽车电池路线之争再生悬念

运营商小试大模型，“1+N”模式浮出水面

作者丨张维佳

编辑丨赵晨

美编丨马利亚

监制丨连晓东

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

热点事件追踪