Redian新闻
>
马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

公众号新闻
丰色 西风 发自 凹非寺
量子位 | 公众号 QbitAI

就在刚刚,马斯克Grok大模型宣布重大升级。

难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能力。

来自xAI的官方推送啥也没说,直接甩链接。主打一个“字少事大

新版本Grok有啥突破?

一是上下文长度飙升,从8192增长到128k,和GPT-4齐平。

二是推理性能大幅提升,数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4

消息一出,评论区立刻就躁起来了。

具体跑分结果如何,咱们立马来看。

Grok-1.5来了

首先,对于上下文窗口。

这次是一把直接提升到之前的16倍,来到128k量级。

这也就意味着Grok可以处理更长和更复杂的提示,同时保持其遵循指令的能力。

在“大海捞针”(NIAH)测试中,Grok-1.5在128K token的上下文中完美检索嵌入的文本。

整个图一水儿的蓝色(100%的检索深度)

其次,推理方面。

Grok-1.5处理编程和数学相关任务的能力大幅提升,全面超越Grok-1、Mistral Large、Claude 2。

数学方面,Grok-1.5在MATH基准测试上得分50.6%,超越中杯Claude 3 Sonnet;GSM8K上得分90%。

编程方面,Grok-1.5在HumanEval基准测试上得分74.1%,超越中杯Claude 3 Sonnet、Gemini Pro1.5、GPT-4,仅次于大杯Claude 3 Opus。

看起来,Grok这次的实力也是不可小觑。

Grok系列与其他大模型相比还有一个特色,不使用通用的Python语言+Pytorch框架。

据官方介绍,Grok 1.5采用分布式训练架构,使用Rust、JAX+Kubernetes构建。

为了提高训练可靠性和维持正常运行时间,团队提出了自定义训练协调器,可自动检测到有问题的节点,然后剔除。

除此之外,他们还优化了checkpointing、数据加载和训练重启等流程,最大限度地减少故障停机时间。

这,才速速有了现在的Grok 1.5~

更多信息官方也暂时还没有披露。

可以确定的是,新版本未来几天会先推送给早期测试者。并按照“老规矩”,很快将在𝕏平台上线。

网友们表示:Grok进步真的相当迅速。

不提别的,Grok新版本各指标已经全面超越Claude 2。而xAI成立仅一年,只比Anthropic落后9个月。因此:

打赌12个月后,xAI完全有可能成为领导者。

还有人评价更高,认为马斯克这是发了另一个“GPT-4等效模型”,喊着:

OpenAI搞快点啊。

你期待新版本的Grok吗?

参考链接:
[1]
https://twitter.com/xai/status/1773510159740063860
[2]https://x.ai/blog/grok-1.5

评选报名即将截止!

2024年值得关注的AIGC企业&产品

量子位正在评选2024年最值得关注的AIGC企业、 2024年最值得期待的AIGC产品两类奖项,欢迎报名评选评选报名 截至2024年3月31日 

中国AIGC产业峰会「你好,新应用!」已开启报名!点击报名参会 同时,峰会将进行线上直播 ⬇️


点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
国内首个开源千亿参数MoE大模型来了!性能超Grok-1,单张GPU可跑马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!GPT-4劲敌Claude 3来了,上下文和多模态显著提升:OpenAI是可被超越的3个月砸1000万美元肝出“最强”大模型?黑马Databricks:我们完虐Grok、Llama,还更开放马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文谷歌7大模型22项AI大招轰炸:70秒视频生成、Gemini安卓合体、200万tokens上下文OpenAI CEO Sam Altman斯坦福闭门会!GPT-5将远超GPT-4!马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o马斯克发布Grok 1.5! 编码和数学能力大幅提升刚刚,马斯克突然发布 Grok 1.5 大模型,但除了这点都不如 GPT-4JHU/WashU/UCSB三校放榜!JHU缩招13%!WashU录取缩水...3 个月砸 1000 万美元肝出“最强”大模型?黑马 Databricks:我们完虐 Grok、Llama,还更开放冰岛印象(5)看今年奥斯卡提名电影"留守者"“报”:华人世界第一行为准则旧文新感--和润涛阎的曾经对话马斯克官宣 Grok-1.5!超 GPT-4 16 倍上下文,推理能力超 DBRX,网友:赢在敢说!全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报AI早知道|ChatGPT灰度测试多GPTs协同;新Bard逆袭GPT-4;百川智能发布Baichuan3LongRoPE:超越极限,将大模型上下文窗口扩展超过200万tokensMeta等发布巨齿鲨Megalodon!无限上下文长度的高效大模型预训练和推理多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作模型上下文长度达到10000000,又一批创业者完蛋了?AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了无位置编码 (NoPE) 也有长度泛化问题?首个针对NoPE的长度外推方法革命新架构掀翻Transformer!无限上下文处理,2万亿token碾压Llama 2从AI服务器谈HBM、HBM2、HBM3、HBM3e技术开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星【五絕】讀詩小感GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4百万token上下文窗口也杀不死向量数据库?CPU笑了OpenAI有望在今年夏季推出GPT-5;英伟达推出更强GPU芯片;马斯克宣布正式开源Grok-1|AIGC周观察第三十七期OpenAI CEO最新演讲:GPT-5性能远超GPT-4;媲美Sora,视频生成模型EMO上线通义APP丨AIGC日报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。