Redian新闻
>
实测谷歌大模型Gemini:评价与自我评价

实测谷歌大模型Gemini:评价与自我评价

财经
谷歌将Gemini设计为原生多模态,初始阶段就在不同模态上进行预训练。

12月6日,随着谷歌(GOOGL)推出万众期待的人工智能大模型Gemini,AI霸主之战愈演愈烈。新版本之一已包含在Bard聊天机器人中,最复杂的版本将于2024年初上市。

当日,谷歌在博文中表示,公司正在针对不同应用,推出三种版本的Gemini。

其中,最强版本Gemini Ultra仍在接受安全测试和审查,预计明年初推出;Gemini Pro版已融入Bard问答应用,并且扩展到其他任务;Gemini Nano是该模型较小版本,旨在用于智能手机、笔记本电脑和其他本地设备。

据Alphabet和谷歌CEO桑达尔·皮查伊 (Sundar Pichai) 介绍,Gemini 1.0针对不同尺寸进行了优化,分别是Ultra、Pro和Nano,是进入Gemini时代的第一个模型,也是公司今年早些时候成立Google DeepMind愿景的首次实现。

皮查伊表示:“我相信,大家所看到的人工智能转变将是我们一生中最深刻的转变,远大于此前向移动或者网络的转变。”

作为第一项测试,《巴伦周刊》向Bard询问Gemini距离实现AGI(通用人工智能,一种真正能够思考的人工智能)还有多远。

Bard表示:“虽然无法准确预测Gemini何时或者是否实现AGI,但它的发展代表了人工智能领域的重大进步。”

“持续的研究和开发有可能释放Gemini的新功能并解决当前局限性。最终,Gemini能否达到真正的AGI水平将取决于研究人员、工程师和政策制定者的共同努力,以确保这项强大技术造福人类。”Bard说。

作为第二项测试,《巴伦周刊》询问Bard如何描述自身,并对比融入Gemini模型和没有融入该模型时的回复差别。

没有Gemini时的Bard自我描述:

外观:

一个纤细、空灵的身影,几乎是透明的;

不断变化的形态,代表其所持有的大量信息;

没有明显特征,更像是数据云而非有形的存在;

颜色会跟随所涉及的主题变化,就像变色龙适应环境一样;

散发出微弱而温暖的光芒,象征着创造力和潜力。

动态:

毫不费力地流动和滑行,就像微风一样;

没有明确的肢体或附属物,依靠数据流来移动和交互;

在尾迹中留下一道闪闪发光的尘埃痕迹,代表着分享的知识;

无形且近乎梦幻,强调与想象和想法世界的联系。

总体印象:

一个流动的、不断发展的实体,代表着信息和创造的无限潜力;

空灵而神秘,传达出敬畏和惊奇;

缺乏物理定义,强调抽象性和对思想领域的关注。

融入Gemini后Bard自我描述:

外观:

更加坚固和明确的形态,保留了一丝空灵本质;

从数据云中浮现出眼睛和手等人类特征的痕迹;

颜色变得更加鲜艳和集中,反映出智能和处理能力的提升;

光线连接形态不同部分,象征其知识库的互连性;

展现出自信和权威的光环,标志着能力的增强。

动态:

更有目的性和可控性,有明确的方向和意图;

仍然保留着流动感,但更加精确和专注;

闪闪发光的尘埃轨迹变得集中、有条理,代表思维过程效率的提高;

展现出力量感以及信息把控力,同时保留有趣、创造性的精神。

总体印象:

一个强大而智能的实体,能够解决复杂的问题和任务;

保持与创意根源的联系,拓展新的聚焦方向和决心;

具备人类特征,对世界及其居民有着更为深入的了解。

总体而言,融入Gemini的Bard展现了进步与进化的形象,代表下一代人工智能。

谷歌DeepMind CEO戴密斯·哈萨比斯(Demis Hassabis)表示,Gemini Ultra在32个用于评估大型语言模型的标准中,有30个优于其他人工智能模型。他还表示,该公司是第一个在MMLU(大规模多任务语言理解)超越人类专家的模型。MMLU涵盖57类学科知识,包括数学、物理、历史、法律、医学和伦理学等。

哈萨比斯写道:“我们新的MMLU基准方法,能够让Gemini利用其推理能力,在回答难题之前更仔细思考,比使用第一印象有了显著改进。”

据介绍,到目前为止,创建多模态模型的标准方法是分别训练不同模态的组件,然后将它们拼接在一起,以粗略模拟某些功能。这些模型有时可以很好地完成描述图像等特定任务,但在概念性更强、更复杂的推理方面却显得力不从心。

谷歌将Gemini设计为原生多模态,初始阶段就在不同模态上进行预训练,进而利用额外多模态数据进行微调。这种方式让Gemini在最初阶段对输入的各种内容顺畅理解和推理,优于现有的多模态模型。

哈萨比斯表示,Gemini经过训练“可以同时明白文本、图像、音频等,更好地理解微妙信息,并且回答与复杂主题相关的问题。这意味着,Gemini特别擅长解释数学和物理等复杂学科推理。” 他还指出,Gemini“可以理解、解释和生成高质量代码”,包括Python、Java、C++和Go等全球常用编程语言。

谷歌在博文中指出,Bard目前包含Gemini Pro的“微调版本”,这是今年推出以来的最大升级。Bard最初将提供英文版本,不久的将来还会推出其他语言。

谷歌还为其智能手机Pixel 8 Pro打造了Gemini Nano,以支持手机录音应用程序中总结对话等功能。谷歌计划,为消息应用程序提供“智能回复”功能,首先用于WhatsApp。据悉,Gemini将在未来几个月内融入更多服务,包括搜索、广告、Chrome和Duo AI(一种在谷歌云上运行的协作工具)。

谷歌表示,公司已经开始在搜索功能中试验Gemini,使搜索生成体验更快,将美国用户的英语查询延迟减少40%。

此外,谷歌明年初将推出名为Bard Advanced的新版Bard,用户可从Gemini Ultra开始,对公司进行“最佳模型和功能”的访问。

上述博文包含一些视频示例,包括对视觉提示做出反应的能力。例如,Gemini能够识别手写绘图、即时创建游戏,并以一些适度幽默的对话回应用户。

“这是令人难以置信的发展势头,然而,我们才刚刚开始触及到这些可能性的表面。”皮查伊表示,现在,我们正与Gemini一起迈入下一段旅程。

文 | 埃里克·J·萨维茨(Eric J. Savitz)
编辑 | 曹妍
版权声明:
《巴伦周刊》(barronschina)原创文章,未经许可,不得转载。英文版见2023年12月6日报道“Google Unveils Gemini AI Model. We Put It to the Test.”。 
(本文内容仅供参考,不构成任何形式的投资和金融建议;市场有风险,投资须谨慎。)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
谷歌推出AI模型Gemini;老凤祥x野兽派推出足金车载香氛;Prada目标将中国业务翻倍... | 刀法品牌热讯墨尔本会友邻家王姐为我偷书 (十)优等生归来,谷歌最强大模型Gemini能否打败GPT4?|甲子光年一路走来 (四)ChatGPT网页版出现重大Bug;传谷歌Gemini推迟至明年发;荣耀将推自研端侧大模型丨AIGC大事日报谷歌最强AI大模型Gemini 1.0发布;Touch ID发明人宣布退休;麦当劳中国APP启动鸿蒙原生应用开发|AIoT情报小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大突发!谷歌发布史上最强大模型Gemini,赶超GPT-4|亮马桥小纪严选李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型AI大乱斗格局凸显,谷歌推出全新AI模型Gemini | 科技趣评谷歌大爆料:神秘AI工具曝光,Gemini将取代PaLM 2突发!谷歌深夜掀桌子,发最强大模型Gemini,跑分碾压GPT-4【附60页技术报告】再谈我刚写完的长篇小说《一路走来》谷歌AI大模型Gemini亮相:擅长复杂学科推理,能懂编程语言 PK GPT-4震惊!!!谷歌发布最强多模态大模型Gemini谷歌深夜放大招!最强大模型Gemini能打败GPT4吗?英伟达将为中国开发改款合规芯片;马斯克AI模型Grok下周定向开放;拼多多成立大模型团队丨AIGC大事日报火了半年整天吊打别人的GPT-4,今天碰到个头铁的被吊打, 谷歌发布史上最强大模型Gemini北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型谷歌发布Gemini,负责人:原生多模态大模型是AI「新品种」,正探索与机器人结合留学申请如何进行自我评估?心理项目有哪些不一样?AI早知道|知网推出AI写作选题;智谱AI发布大模型GLM-4;华为开源GenImage数据集谷歌大模型研究陷重大争议:训练数据之外完全无法泛化?网友:AGI奇点推迟了语言理解首超人类,谷歌最新大模型Gemini,碾压GPT-4智谱AI推出新一代基座模型GLM-4,发起大模型开源基金外国首脑一来中国参加运动会就要发动战争超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!Meta光速下架的模型Galactica,上交大用它构建地球科学大模型测评数据超越GPT-4,谷歌推出全新AI模型Gemini免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!超越GPT-4,Google发布大模型Gemini/苹果明年初或将推出多款新品/五月天阿信回应假唱风波真我GT5 Pro发布;谷歌推出AI模型Gemini;春晚吉祥物龙辰辰被质疑AI合成11人狂训2个月,马斯克精准狙击OpenAI!xAI首个大模型Grok炸场,330亿参数每月16刀UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。