Redian新闻
>
刚刚,马斯克突然发布 Grok 1.5 大模型,但除了这点都不如 GPT-4

刚刚,马斯克突然发布 Grok 1.5 大模型,但除了这点都不如 GPT-4

科技

就在刚刚,马斯克旗下的 xAI 团队突然发布了 Grok-1.5 大模型。
一周前,在众多质疑声中,马斯克如约开源了 GroK-1。今天发布的 Grok-1.5 则在推理和上下文理解能力上有了显著提升。
从基准测试结果来看,Grok-1.5 的能力迎来了巨大的飞跃,全然碾压了此前热门的开源模型 Mistral Large、Claude 2 等,即使面对「宿敌」GPT-4,也互有胜负。
附上博客原文链接:https://x.ai/blog/grok-1.5
Grok-1.5 在编码和数学领域任务处理能力上迈上了一个比较大的台阶。
从基准测试的结果来看,Grok-1.5 在 MATH 基准测试中取得了 50.6% 的得分,在 GSM8K 基准上,Grok-1.5 获得了 90% 的得分,这两个测试都涵盖了从基础算术到高级数学的广泛领域。
此外,Grok-1.5 在评估代码生成和解决问题能力的 HumanEval 基准测试中得分为 74.1%,超越了 GPT-4。
对此,xAI 团队核心成员也为 Grok-1.5 摇旗呐喊:「我们最新的推理能力升级。在从 Grok 1 版本升级到 1.5 版本的过程中,数学推理能力从 24 %提升至 50%。」
Grok-1.5 另一个比较大的升级是其上下文窗口扩展至 128K,飙升 16 倍,提升到了与 GPT-4 Turbo 相同的档次,能够处理相当于 300 页的文本,相当于可以塞进一部中篇小说。
看起来强得可怕
在处理的文本量大幅提升之余,Grok-1.5 的能力也没落下。在大海捞针(NIAH)的测试中,Grok-1.5 展现了强大的检索能力,瞧瞧这清一水的蓝色,看起来强得可怕。
据 xAI 官方介绍,Grok-1.5 建立在基于 JAX、Rust 和 Kubernetes 构建的自定义分布式训练框架之上。
在大型计算集群上训练 LLMs 时,确保训练作业的高可靠性和长时间的正常运行是一项主要挑战。xAI 团队的自定义训练协调器能够自动检测并排除训练过程中的问题节点。
此外,xAI 团队还优化了检查点创建、数据加载和训练作业重启流程,以减少任何故障导致的停机时间。
Grok-1.5 未来几天内将会向一部分群体开放,后续也将逐步向公众开放。
作为对比,开源的 Grok 1.0 是拥有 314B 参数的先进混合专家模型,也是截至目前参数量最大的开源大型语言模型,其规模相当于 Meta LlaMA 2 70B 的 4.4 倍。
根据 Apache 2.0 许可协议, 现在公众可以自由访问模型的权重和架构。以下是关于 Grok 1.0 的一些关键信息:

模型参数数量高达 314B

混合专家模型(MoE 架构)

每一个数据单元由 2 位专家处理

嵌入向量的维度为 6144

采用旋转式嵌入表示
在 MMLU、GSM8K 等一系列的基准测试中,Grok 1 的表现远胜于 LLaMA 2 70B,但和 Claude 2 以及 GPT-4 仍有不小的差距。
卧虎藏龙的 xAI
去年初,The Infomation 就曾报道马斯克正在积极「招兵买马」,意图筹建一个新的研究实验室,以推出 ChatGPT 的劲敌。
xAI 的官网曾详细介绍了拥有 12 名核心成员的初创团队。除了马斯克之外,其他 11 名成员的背景如下:
Igor Babuchkin:
人工智能研究者,在 DeepMind 和 OpenAI 工作时累积过丰富的经验。参与过 AlphaStar 项目(用 AI 在星际争霸上击败人类冠军)。
Manuel Kroiss:
软件工程师。曾在 Google 和 DeepMind 等科技巨头工作,在强化学习和人工智能领域作出过重要贡献。论文「Reverb: A Framework for Experience Replay」的联合作者。
Yuhuai(Tony)Wu :
人工智能研究者、计算机科学家。因其在 Google N2Formal 团队和一家秘密初创公司作为自动化数学家和形式推理方面的工作而闻名。
Christian Szegedy:
在深度学习、人工智能、计算机视觉、影像分析和形式推理方面拥有专业知识。曾就职于 Google, 担任研究科学家。拥有波恩大学应用数学博士学位。
Jimmy Ba:
多伦多大学助理教授。正在领导一项有关深度神经网络高效学习算法的开发研究。CIFAR-AI(加拿大高等研究院人工智能与社会项目)主席,2016 年 Facebook 机器学习研究生奖学金获得者。
Toby Pohlen:
曾任 DeepMind 研究工程师,在机器学习、强化学习领域拥有丰富经验。参与 AlphaStar League 和 Ape-X DQfD 等项目。以全班第一名的成绩毕业于德国亚琛工业大学计算机科学专业。
Ross Nordeen:
曾任特斯拉的技术项目经理,将帮助团队构造过滤器。
Kyle Kosic:
曾就职于 OpenAI 等 AI 公司。拥有丰富的机器学习、物理学和应用数学的学术背景。
Greg Yang:
曾就职于微软研究院,于 2018 年荣获摩根奖 (Morgan Prize) 荣誉奖。
Guodong Zhang:
机器学习和人工智能领域的研究者,曾就职于多伦多大学和矢量研究所(Vector Institute),因研究大语言模型的训练、调整、对齐而闻名,撰写过多篇相关领域的论文。他是 2022 年 Apple 博士奖学金,2020 年 Borealis 人工智能奖学金的获得者。
Zihang Dai:
曾任 Google 研究员,拥有清华大学和卡内基梅隆大学的学位,在百度美国分公司和蒙特利尔大学的 mILA 进行过研究实习。
当然,仅靠这 11 个核心成员就想推出 Grok AI 助手显然是不切实际的,所以 xAI 也同步开启了招人计划,招揽 AI 相关的技术人才加入。
现在,xAI 的技术团队也迎来了极速壮大,甚至光从名字的甄别上,你就能从中发现不少华人活跃的身影。
对于即将到来的 Grok-1.5 ,前 OpenAI 开发者关系主管直接在线点赞。
玩梗这种事,还是得看网友。
前不久,埃隆·马斯克在 X 发文称,本周晚些时候,Grok 将向 X 平台所有订阅高级服务的账户开放。
但这一次,比起免费的开放使用,我们更关心地是,Grok-1.5 短时间内还会开源吗?



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
炸了!!马斯克突然宣布!!GPT马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文【随笔】邂逅世仙纳都(1)——来历不凡说到做到,马斯克开源Grok,3140亿参数免费可商用马斯克宣布正式开源大语言模型Grok;人体避免多个精子使一个卵子受精的机制揭示 | 环球科学要闻马斯克突然访华后,全国“解禁”特斯拉!马斯克突然宣布:推迟访问印度!特斯拉被裁中国员工:有人没拿到“N+3”赔偿,可能会仲裁!今年公司市值已暴跌超2万亿元开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4AI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用AI进化太快了,马斯克开源Grok-1,爆火!马斯克发布全球最大开源模型Grok-1马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星马斯克突然访华或加速自动驾驶落地,今年将投资100亿美元用于AI训练和推理;苹果CEO库克据悉下周将预告新的AI功能丨AI周报黄仁勋扔出的算力核弹​是堆叠吗?马斯克开源的大模型Grok才是全球最大吗?马斯克突然访华!开源日报 | 微软AI程序员登场,马斯克开源Grok;Open-Sora全面开源P70系列有3或4款新品;国内首个开源千亿参数MoE大模型来了,对标马斯克的Grok……过紧日子;掼蛋扑克;特斯拉赛博电动皮卡;燃油宝不是宝刚刚!马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型定西GPT-4级模型Grok开源可商用!卷底层大模型的公司危了马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4无题刚刚,这个全面超越 GPT-4 的大模型,正式推出了 iOS 应用 | 附下载链接华为悬红200万全球求解难题引热议,网友:虽然不会,但是感觉自己亏了;马斯克的超级算力愿景:xAI将建计算超级工厂训练Grok全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报《你把我呼唤》&《须尽欢》马斯克正式开源 Grok-1,成为全球最大的开源大模型1至2月社零总额增长5.5%,马斯克突然开源大模型 | 财经日日评马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!马斯克发全球最大开源模型!3140亿参数的Grok真打脸OpenAI了?许家印组织造假被罚4700万;马斯克开源大模型Grok-1;侯毅正式卸任盒马CEO;英伟达推出最强AI芯片...马斯克官宣 Grok-1.5!超 GPT-4 16 倍上下文,推理能力超 DBRX,网友:赢在敢说!OpenAI有望在今年夏季推出GPT-5;英伟达推出更强GPU芯片;马斯克宣布正式开源Grok-1|AIGC周观察第三十七期
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。