Redian新闻
>
GPT-4级模型Grok开源可商用!卷底层大模型的公司危了

GPT-4级模型Grok开源可商用!卷底层大模型的公司危了

科技

夕小瑶科技说 原创
作者 | 醒醒
上周,马斯克宣布 xAI 将开源 Grok。

刚刚,马斯克终于兑现诺言,xAI 宣布开源了 Grok-1 的模型权重和网络架构。

Grok-1 是一个拥有 3140亿 参数的专家混合模型,由xAI从头开始训练,模型实际只有 25% 的参数被激活,也就是实际激活的参数数量只有 86B。

这个架构和参数量,与网传的GPT-4模型高度相似,完全可以说是有意为之的GPT-4复刻版了。

xAI 官方博客中 提到Grok-1模型由8个专家组成,64层Transformer,每层包括多头注意力块和密集块。模型的上下文长度为 8192个token,采用bf16计算精度,权重使用 8bit 量化。

Grok-1 模型是在大量文本数据上训练,训练完成和模型权重保存截止到 2023年10月,未针对任何特定任务进行微调。

此外,还包含了模型的技术细节:

• 使用了旋转位置嵌入(Rotary Embeddings),提高了模型的位置编码能力。

• 131072个词量,embedding-dim为6144,64层Transformer。

• 上下文长度达到8192个 token,采用bf16计算精度,对权重使用8位量化,用于优化模型的运行效率和资源消耗。

代码和模型权重已上线GitHub,目前github上已有6.9k标星。

模型下载地址:
https://github.com/xai-org/grok-1

Grok-1采用的是Apache 2.0 license,意味着,可商用。

有趣的是,ChatGPT的账号竟和马斯克互掐起来了,不知道ChatGPT背后是人还是机器人。

此前马斯克向法院对OpenAI提起诉讼,控告Sam违背公司创立初衷,不开源GPT。

如今马斯克以身作则,率先开源自家大模型Grok, 撇开赌气成分不谈,但马斯克的公众形象始终是站在造福人类大众一方,而本次Grok的开源,是给大模型开源社区带来一些鲶鱼效应,期待可以给社区带来惊喜。

参考资料

 [1]https://x.ai/blog/grok-os

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
马斯克发布全球最大开源模型Grok-17026 血壮山河之枣宜会战 “扑朔迷离”的南瓜店 3【解字】福兮祸兮国内首个开源千亿参数MoE大模型来了!性能超Grok-1,单张GPU可跑开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4GPT开源日报 | 微软AI程序员登场,马斯克开源Grok;Open-Sora全面开源刚刚!马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型马斯克宣布正式开源大语言模型Grok;人体避免多个精子使一个卵子受精的机制揭示 | 环球科学要闻0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练黄仁勋扔出的算力核弹​是堆叠吗?马斯克开源的大模型Grok才是全球最大吗?最强开源大模型 Llama 3震撼发布!开源模型将追上GPT-4,4000亿参数模型也在路上安远AI&北京大学:2024基础模型的负责任开源-超越开源闭源的二元对立:负责任开源的内涵、实践与方案报告刚刚,马斯克突然发布 Grok 1.5 大模型,但除了这点都不如 GPT-4马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文Llama 3突然来袭!开源社区再次沸腾:GPT-4级别模型可以自由访问的时代到来OpenAI有望在今年夏季推出GPT-5;英伟达推出更强GPU芯片;马斯克宣布正式开源Grok-1|AIGC周观察第三十七期许家印组织造假被罚4700万;马斯克开源大模型Grok-1;侯毅正式卸任盒马CEO;英伟达推出最强AI芯片...微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了P70系列有3或4款新品;国内首个开源千亿参数MoE大模型来了,对标马斯克的Grok……朱令铊中毒的真相(三)全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报马斯克正式开源 Grok-1,成为全球最大的开源大模型今日arXiv最热NLP大模型论文:一文读懂大模型的prompt技术iPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端?马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星神秘模型gpt2-chatbot实力被赞超越GPT-4:sam亲自确认,或是OpenAI全新模型AI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用智谱AI推出新一代基座模型GLM-4,发起大模型开源基金说到做到,马斯克开源Grok,3140亿参数免费可商用Google发布最强开源大模型Gemma/苹果OLED产品路线图曝光/小米汽车价格定了?高管辟谣《繁花》,梅萍的一句话让人细思极恐大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事《我渴望遇见你》&《岁月带走了青春年华》谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用贾玲公开瘦身食谱;马云妻子被曝在新加坡购房;报告称养娃到本科毕业平均花费68万元;谷歌发布开源AI大模型Gemma...
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。