Redian新闻
>
传谷歌开始小范围测试Gemini:比训练GPT-4算力大5倍,多模态能力大提升

传谷歌开始小范围测试Gemini:比训练GPT-4算力大5倍,多模态能力大提升

公众号新闻

机器之心报道

编辑:蛋酱


今年 5 月的谷歌 I/O 大会上,皮查伊宣布了对标 GPT-4 的大模型 PaLM 2,但同时也提到谷歌的研究重心正在转向 Gemini,后者是一种多模态和高效的机器学习工具。

为了更快地开发 Gemini,谷歌在今年 4 月份合并了内部的两个人工智能实验室:谷歌大脑(Google Brain)和 DeepMind,Gemini 这项联合计划就由来自两个实验室的研究人员组成的团队牵头。

接下来几个月,Gemini 的神秘面纱一点点被揭开:我们大概知道该模型是在 Google Brain 和 DeepMind 合并之后开始研发的,将具有像 GPT-4 一样的万亿参数;Gemini 在训练中已经展示出了以往模型中从未见过的多模态能力;一旦经过微调和严格的安全性测试,谷歌同样将提供不同尺寸和功能的 Gemini 版本,以确保部署在不同的产品、应用和设备上。

最新消息是,据三位直接知情人士透露,谷歌已经允许一小部分公司使用 Gemini 软件的早期版本,意味着谷歌即将将其纳入消费者服务,并通过公司的云计算服务出售给企业。


能否超越 GPT-4?

近日,SemiAnalysis 分析师 Dylan Patel 和 Daniel Nishball 带来了更多关于 Gemini 的爆料,其中 Dylan Patel 曾在今年 7 月 11 日曾曝光 GPT-4 的架构


Dylan Patel 和 Daniel Nishball 透露,初代的 Gemini 应该是在 TPUv4 上训练的,并且这些 pod 并没有集成最大的芯片数 —4096 个芯片,而是使用了较少的芯片数量,以保证芯片的可靠性和热插拔。如果所有 14 个 pod 都在合理的掩模场利用率 (MFU) 下使用了约 100 天,那么训练 Gemini 的硬件 FLOPS 将超过 1e26。

不过,Gemini 已开始在新的 TPUv5 Pod 上进行训练,算力高达~1e26 FLOPS,比训练 GPT-4 的算力还要大 5 倍。

另外,Gemini 的训练数据库为 Youtube 上 93.6 亿分钟的视频字幕,总数据集大小约为 GPT-4 的两倍。

Gemini 由一组大型语言模型组成,可能使用 MOE 架构与投机采样(Speculative Sampling)技术,通过小模型提前生成 token 传输至大模型进行评估,提高模型总推理速度。

从能力上说,Gemini 支持从聊天机器人到总结文本或生成原始文本(如电子邮件草稿、歌词或新闻文章)的各种功能,这些功能都是基于对用户想要阅读的内容的描述。此外,Gemini 还能帮助软件工程师编写代码,并根据用户的要求生成原始图片。

据 The Information 此前报道,谷歌希望 Gemini 大大提高软件开发人员的代码生成能力,以此追赶微软的 GitHub Copilot 代码助手。

谷歌员工还讨论过利用 Gemini 来实现图表分析等功能,比如要求模型解释完成图表的含义,以及使用文本或语音指令来浏览网页浏览器或其他软件。

一位测试过 GPT-4 的人士说,Gemini 至少在一个方面比 GPT-4 更具优势:除了网络上的公共信息外,Gemini 利用了谷歌从其消费产品中获取的大量专有数据。因此,该模型在理解用户对特定查询的意图时应该会特别准确,而且它似乎会产生较少的错误答案(即幻觉)。

谷歌云服务迎头赶上的机会

自今年年初 OpenAI 开始出售 GPT-4 的访问权限以来,谷歌近几个月来一直在积极地将其现有的商用模型提供给更多的开发者。

今年 5 月,谷歌宣布将通 Vertex AI 向谷歌云客户提供 PaLM 2 。另一位知情人士说,谷歌计划通 Google Cloud Vertex AI service 向企业提供「Gemini」,包含不同大小的版本,这样开发者就可以选择付费购买一个不太复杂的版本来处理简单的任务,或者购买一个足够小的版本在个人设备上运行。

这位知情人士补充说,谷歌目前让开发者使用的是相对较大的 Gemini 版本,但不是正在开发的最大版本,后者更接近于 GPT-4。


对谷歌来说,Gemini 的发布事关重大。谷歌花费了大量的计算资源和人力来开发它作为与 OpenAI 竞争的利器,希望这款软件除了促进其云服务器租赁业务外,还能为从 Bard 聊天机器人到 Workspace 软件的新功能提供支持。

据 The Information 报道,OpenAI 和其他软件公司(如帮助公司开发和使用人工智能的 Databricks)也预测,它们将从对话式 AI 中获得可观的收入。然而,开源大模型的崛起可能会削弱谷歌和 OpenAI 出售其专有模型访问权的关注度。

也许某天一觉醒来,Gemini 已经正式发布,届时它的神秘面纱将被彻底揭开。

谷歌能否凭借 Gemini 扭转局势?我们只需耐心等待。


参考链接:https://www.theinformation.com/articles/google-nears-release-of-gemini-ai-to-rival-openai

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
华为 Mate 60 Pro一分钟售罄;传 OpenAI 秘密训练GPT-5;中国全年汽车出口或超 500 万辆 | 极客早知道历史小说《黄裳元吉》第一百一十六章 流星谷歌火力全开!新一代芯片TPU v5e炸场,大模型训练飙升5倍,成本砍半报告丨这份AI研究报告,快速搞清楚ChatGPT、Gen-AI、大模型、多模态...AI搞定谷歌验证码,最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队实现输入到输出「模态自由」, NUS华人团队开源NExT-GPT,最接近AGI的大一统多模态大模型来了树莓派5来了:算力提升2.5倍,支持PCIe,438元起售单卡对标A100!讯飞华为发布大模型一体机,星火升级代码多模态能力,现场几分钟实现凌空手写爱之魂谷歌新模型的算力已是GPT-4的5倍,要大力出奇迹反超OpenAI了?DeepMind推出AI图像识别工具;华为Mate 60 Pro接入盘古大模型;传谷歌Gemini算力达GPT-4五倍上海内推 | 小红书多模态算法组招聘多模态CV/NLP算法实习生李彦宏:创业者卷大模型没意义;网传“美国邀请任正非去美国”不实;腾讯小范围测试消金产品“分期”;茅台酒心巧克力将面市...个人的行为法则(第一章摘要)北大&腾讯打造多模态15边形战士!语言作“纽带”,拳打脚踢各模态,超越Imagebind阿里云中标9亿AI算力大单;浙大校友开源LLaVA-1.5多模态大模型;Meta因开源模型遭抗议丨AIGC大事日报未央播报 | 两部门鼓励加大数据和人工智能基础设施建设 腾讯小范围测试消金产品“分期”从零训练一个多模态LLM:预训练+指令微调+对齐+融合多模态+链接外部系统《春天你在哪里》&《缘份》GPT-4V多模态能力惊人!公式截图直出代码,「龙与魔法世界」瞬间生成,OpenAI总裁激动转发侵吞全球算力!谷歌Gemini被曝算力达GPT-4五倍,手握TPU王牌碾压OpenAI「专题速递」GPU算力思考、内容生产技术实践、AI动漫、多模态可控的作曲框架传OpenAI秘密训练GPT-5;腾讯混元大模型或本周亮相;首个中英语音多模态LLM开源𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶内衣裤,软弹有度,上身0束缚~代码解释器等于GPT-4.5!不训练GPT-5,OpenAI依然向AGI狂飙树莓派5来了!算力提升2.5倍,支持PCIe,438元起售!GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gimini!GPT-5明年降临?爆料人泄露多模态Gobi就是GPT-5,已初现自我意识MiniGPT-4升级到MiniGPT-v2了,不用GPT-4照样完成多模态任务GPT-4完成正确率仅6%!北大等提出首个「多轮、多模态」PPT任务完成基准PPTC11Labs:声音模态能否突围OpenAI?东瀛气象鹧鸪天(2)UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源GPT-4大杀器谷歌Gemini来袭!26位研发大佬名单曝出,祭出类Midjourney生图能力清华团队攻破GPT-4V、谷歌Bard等模型,商用多模态大模型也脆弱?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。