Redian新闻
>
史上最强开源大模型 Llama 3正式发布。。。

史上最强开源大模型 Llama 3正式发布。。。

科技

关注飞总聊IT,了解IT行业的方方面面。


Meta宣布,Llama3的80亿和700亿参数版本发布了。


这款开源的大模型是真的牛逼了。


根据Meta的数据,小一点的8B模型,在MMUL,GPQA,HumanEval等一系列测试中,都超过了Gemma7B和Mistral 7B。


而更牛逼的70B模型,则可以和Claude 3 Sonnet以及谷歌的Gemini Pro 1.5 PK,毫无毛病。


Meta还有一个没开源的400B的,在training中。据说这个400B的更牛逼,和Claude 3 Opus也能干起来,干翻GPT 3.5也是不在话下。至于GPT 4的话,可能还有点距离。


据说训练Llama 3的数据规模达到了15T的token,比之前的版本多了7倍。这就让Llama 3显得尤其牛逼了。


当然,Llama 3 也不是没缺点,上下文窗口长度目前只有8k。不过我估计这也不是什么问题,在Meta的加持下,只是时间问题。


为了训练这个模型,Meta用了两套的24k H100。这是真的有点土豪了。不得不说Meta实在是有钱买显卡啊。一般的公司大概率是不敢这么豪横的。


当然,对于中文社区来说,肯定还是有点遗憾。这个模型的语料里面5%的是非英文,其他的都是英文和代码。总体来说,Llama的中文表现并不是很理想。


总体来说,Meta砸了重金,训练了一个特别牛逼的模型,开源了,可谓土豪菩萨,撒钱贡献开源毫不含糊。


所以在今天股票市场一片大跌的前提下,Meta的股票竟然逆势涨了起来。一度涨幅高达3%。


我们可以这样说,OpenAI是个假的Open,真的OpenAI来自Meta。只有Meta才是新时代大语言模型的活菩萨活雷锋。


小札自从元宇宙搞失败以后,是彻底转型成为AI大语言模型领军人物了。难怪Meta的股价在跌破100以后能如此迅速回到500以上。


我又要讲个鬼故事了。前段时间,Databricks宣布了它家的开源模型DBRX跑分跑了第一。据说训练花了1000万美元。


这个模型还没让Databricks高兴多久,Llama 3这种逆天的大模型就出来了,不知道1000万美元和2套24k的H100比起来,到底算啥呢?


Databricks是不是应该砸3套24k的H100,训练一个DBRX3.0出来,拳打Llama 3,脚踢GPT 4?


我开玩笑了,毕竟土豪是土豪,新贵是新贵,1个T的和43个B的体量,还是不能比的。


Meta的这个开源,是不是又要催生出一堆在Meta架构上训练的,或者微调的,新的大模型了。我们拭目以待。


好巧不巧的,最近发现Snowflake也招了一个微软的人去做大模型了。


不知道Snowflake接下来会讲出什么样的鬼故事来,也不知道这个鬼故事有没有人愿意去听。


我最近写的专栏,讲职场的故事,有兴趣的可以订阅,有很多人说学到了经验,不喜欢的一天内可以退款


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Databricks开源大模型DBRX,以及这对Databricks公司的商业,估值,上市等方面的影响。。。华为 Pura 70 系列上架即售罄/Meta 发布全球最强开源大模型/理想汽车 L6 发布Meta震撼发布Llama 3,一夜重回开源大模型铁王座好朋友意外离世谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用猫贝贝之歌(1)Google发布最强开源大模型Gemma/苹果OLED产品路线图曝光/小米汽车价格定了?高管辟谣性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!《阴阳鱼》连载第29章:时间如刀,空间如砧板,而你我都不过是鱼肉卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了李彦宏:开源大模型不如闭源,后者会持续领先;周鸿祎:“开源不如闭源” 的言论是胡说八道AI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4最强开源大模型深夜炸场! Llama 3 王者归来,直逼 GPT-4, 马斯克点赞 | 附体验链接哈尔滨啤酒检出呕吐毒素;Meta发布开源大模型Llama 3丨大公司动态傅平自传体回忆录(25)精彩纷呈在最后,未完待续,敬请关注!全球最强开源模型一夜易主,1320亿参数推理飙升2倍大自然的力量真神奇啊。。。。。。。马斯克正式开源 Grok-1,成为全球最大的开源大模型最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍猫贝贝之歌(2)- 夜太黑张核子回应张姗姗身份;雷军直播回应造车亏损;Meta发布最强开源大模型Llama 3;阿里拍卖回应前员工指控高管职场霸凌|邦早报扎克伯格的Llama 3号称全球最强开源模型!却写不好这个……许家印组织造假被罚4700万;马斯克开源大模型Grok-1;侯毅正式卸任盒马CEO;英伟达推出最强AI芯片...扎克伯格最新采访:Meta最强开源模型Llama 3凭什么值百亿美金开放开源!蚂蚁集团浙江大学联合发布开源大模型知识抽取框架OneKE最强开源大模型 Llama 3震撼发布!开源模型将追上GPT-4,4000亿参数模型也在路上Meta、微软、Mistral AI、Hugging Face、通义、港中文六路进发开源大模型 | 大模型一周大事新测试基准发布,最强开源Llama 3尴尬了开源大模型火了!(附99个大模型微调模型/数据/工具)!OpenAI劲敌出手!Claude 3正式发布,超越GPT-4,一口气读15万单词扎克伯格最新2万字访谈:价值百亿美金的“最强开源大模型”Llama3及背后的一切全球最强开源模型一夜易主,1320亿参数推理飙升2倍!周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。