国际科技财经博客移民网络热点娱乐民生时事公众号

>

GPT-4级模型Grok开源可商用！卷底层大模型的公司危了

GPT-4级模型Grok开源可商用！卷底层大模型的公司危了

2024-03-18 04:03

夕小瑶科技说原创
作者 | 醒醒上周，马斯克宣布 xAI 将开源 Grok。

刚刚，马斯克终于兑现诺言，xAI 宣布开源了 Grok-1 的模型权重和网络架构。

Grok-1 是一个拥有 3140亿参数的专家混合模型，由xAI从头开始训练，模型实际只有 25% 的参数被激活，也就是实际激活的参数数量只有 86B。

这个架构和参数量，与网传的GPT-4模型高度相似，完全可以说是有意为之的GPT-4复刻版了。

xAI 官方博客中提到Grok-1模型由8个专家组成，64层Transformer，每层包括多头注意力块和密集块。模型的上下文长度为 8192个token，采用bf16计算精度，权重使用 8bit 量化。

Grok-1 模型是在大量文本数据上训练，训练完成和模型权重保存截止到 2023年10月，未针对任何特定任务进行微调。

此外，还包含了模型的技术细节：

• 使用了旋转位置嵌入（Rotary Embeddings），提高了模型的位置编码能力。

• 131072个词量，embedding-dim为6144，64层Transformer。

• 上下文长度达到8192个 token，采用bf16计算精度，对权重使用8位量化，用于优化模型的运行效率和资源消耗。

代码和模型权重已上线GitHub，目前github上已有6.9k标星。

模型下载地址：
https://github.com/xai-org/grok-1

Grok-1采用的是Apache 2.0 license，意味着，可商用。

有趣的是，ChatGPT的账号竟和马斯克互掐起来了，不知道ChatGPT背后是人还是机器人。

此前马斯克向法院对OpenAI提起诉讼，控告Sam违背公司创立初衷，不开源GPT。

如今马斯克以身作则，率先开源自家大模型Grok, 撇开赌气成分不谈，但马斯克的公众形象始终是站在造福人类大众一方，而本次Grok的开源，是给大模型开源社区带来一些鲶鱼效应，期待可以给社区带来惊喜。

参考资料

[1]https://x.ai/blog/grok-os

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

大模型的“瘦身”革命：巨头逐鹿轻量化大模型 | 大模型一周大事马斯克正式开源 Grok-1，成为全球最大的开源大模型最强开源大模型 Llama 3震撼发布！开源模型将追上GPT-4，4000亿参数模型也在路上黄仁勋扔出的算力核弹是堆叠吗？马斯克开源的大模型Grok才是全球最大吗？刚刚！马斯克开源 Grok：参数量近 Llama 四倍，成全球最大开源模型今日arXiv最热NLP大模型论文：一文读懂大模型的prompt技术马斯克发布全球最大开源模型Grok-1 马斯克大模型Grok1.5来了：推理能力大升级，支持128k上下文 OpenAI有望在今年夏季推出GPT-5；英伟达推出更强GPU芯片；马斯克宣布正式开源Grok-1｜AIGC周观察第三十七期 7026 血壮山河之枣宜会战 “扑朔迷离”的南瓜店 3 谷歌最强开源大模型亮相！Gemini技术下放，笔记本就能跑，可商用《繁花》，梅萍的一句话让人细思极恐 GPT 0门槛免费商用！孟子3-13B大模型正式开源，万亿token数据训练 iPhone就能跑！微软推出轻量级模型Phi-3，性能堪比GPT-3.5 Turbo，AI的未来在手机端？未央播报 | 央行进一步推动优化支付服务工作 OpenAI发布多模态大模型GPT-4o 《我渴望遇见你》&《岁月带走了青春年华》马斯克宣布正式开源大语言模型Grok；人体避免多个精子使一个卵子受精的机制揭示 | 环球科学要闻朱令铊中毒的真相(三)昇腾社区回应网传华为发布会大模型生成图片系人工操控；Sam Altman：新款语音模型GPT-4o尚未发货丨AIGC日报 GPT搜索引擎原型曝光！新模型GPT4-Lite驱动，虽然鸽了发布会但代码已上传马斯克打脸OpenAI，全球最大巨无霸模型Grok-1开源！3140亿参数8个MoE，GitHub狂揽6k星开源日报 | 微软AI程序员登场，马斯克开源Grok；Open-Sora全面开源全球顶尖AI研究者中国贡献26%；1320亿参数大模型开源；Anthropic大模型测评首超GPT-4丨AIGC大事日报神秘模型gpt2-chatbot实力被赞超越GPT-4：sam亲自确认，或是OpenAI全新模型贾玲公开瘦身食谱；马云妻子被曝在新加坡购房；报告称养娃到本科毕业平均花费68万元；谷歌发布开源AI大模型Gemma...【解字】福兮祸兮刚刚，马斯克突然发布 Grok 1.5 大模型，但除了这点都不如 GPT-4 微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把GPT-3.5淘汰了安远AI&北京大学：2024基础模型的负责任开源-超越开源闭源的二元对立：负责任开源的内涵、实践与方案报告 OpenAI爆炸更新：GPT-4免费了！新模型GPT-4o发布，视觉、语音能力大幅增强，速度起飞，API打骨折 AI早知道｜马斯克Grok大模型开源；荣耀正式发布首款AI PC；苹果谷歌和OpenAI商谈iPhone大模型使用 GPT 说到做到，马斯克开源Grok，3140亿参数免费可商用国内首个开源千亿参数MoE大模型来了！性能超Grok-1，单张GPU可跑许家印组织造假被罚4700万；马斯克开源大模型Grok-1；侯毅正式卸任盒马CEO；英伟达推出最强AI芯片...智谱AI推出新一代基座模型GLM-4，发起大模型开源基金

热点事件追踪