Redian新闻
>
最强“GPT-4平替”开源!Meta推出免费商用的Llama 2,联手微软掀全球AI狂欢

最强“GPT-4平替”开源!Meta推出免费商用的Llama 2,联手微软掀全球AI狂欢

科技

Meta首个开源可商用大语言模型Llama 2发布。
作者 |  徐珊
编辑 |  水青

今天,Facebook母公司Meta发布其首个开源可商用大语言模型Llama 2

智东西7月19日报道,今天凌晨,Meta在其官网宣布大语言模型Llama 2正式发布,Llama 2是Meta大语言模型Llama模型的最新版本,也是Meta首个免费商用的大语言模型。

该模型目前支持70亿、130亿、700亿等多个参数规模版本。相较Llama 1,Llama 2经过2万亿个tokens训练,其对上下文训练的长度是Llama 1的两倍,达到4096。Llama-2-chat模型还接受了超过100万个人工标注训练。由于其强大的参数规模以及性能表现,不少人称之为“GPT-4最强平替”,也是大模型之战中AI平权的又一例证。

此外,Meta和微软高调宣布将在生成式AI领域联手,微软将成为Llama 2的首选合作伙伴。微软Azure客户将能够在Azure上轻松安全地微调和部署Llama 2模型,快速构建适用于自身业务的专用大模型。

“大语言模型正被企业用作生成式AI的核心要素。”Meta在官网中说道。Llama 2模型的发布,是Meta在大语言模型领域的又一次有力发声。此前,谷歌、微软曾通过接入大语言模型,更新其旗下多个产品线。

OpenAI的GPT-4和Meta的Llama分别是大语言模型领域闭源和开源的代表。全球有众多大模型基于Llama开发而来,但又受限于无法免费商用。随着Llama 2免费开源商用,并与微软这样的云服务商深度合作,开源力量可能重新划分AI市场的格局,对众多大模型应用企业也是好消息。

现在,用户需要通过提交表格的方式即可获得Llama-2-chat模型。用户下载每个模型后,将收到大模型的型号代码规模用户指南信息


论文地址:

https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

项目地址:

https://github.com/facebookresearch/llama

Llama-2-chat
模型下载地址:
https://ai.meta.com/resources/models-and-libraries/llama-downloads/



01.
Llama-2大模型,强在哪里?


Llama 2是一组经过预先训练和精细调整的大型语言模型(LLMS),规模从70亿到700亿参数不等。

目前,Meta正式发布了Llama 2大模型的70亿、130亿、 700亿三个参数规模版本。据悉,Meta还训练了340亿版本,但没有发布。在论文中,我们还发现了330亿和650亿版本的Llama 2训练数据信息。

此次发布过程中,Meta还随着Llama-2大模型提供预训练模型和对话微调版本的模型权重和初始代码

在此次训练中,Meta还相较Llama 1,把预训练语料库的规模增加了40%,将模型的上下文长度增加了一倍,并采用了分组查询注意力(grouped-query attention)方法。

根据Meta公布的测评数据,Llama 2在许多外部基准测试上都优于其他开源语言模型,包括推理、编码、熟练程度和知识测试。基于人类对大模型的有用性以及安全的评估,Llama 2可能是封闭源模型如GPT等的适当替代品。

其中,Llama 2-Chat是针对对话AI场景进行优化的,使用来自人类反馈的强化学习来确保安全性和有用性。

在训练过程中,Llama 2使用公开的在线数据进行预训练。然后通过使用监督微调创建Llama-2-chat的初始版本。接下来,Llama-2-chat会通过人类反馈强化学习第一次出现标注上(RLHF)进行迭代细化,其中包括拒绝采样和近端策略优化(PPO)。

Llama-2大模型将免费用于研究和商业用途。微软是Llama 2的首选合作伙伴。据悉,Llama 2可在Azure AI模型目录中使用,使用Microsoft Azure的开发人员能够使用它进行构建,并利用其云原生工具进行内容过滤和安全功能。

Llama 2还针对在Windows的本地运行进行了优化,为开发人员提供了无缝工作流程,为跨不同平台的客户带来生成式AI体验。目前,Llama2也可通过Amazon Web Services(AWS)、Hugging Face和其他提供商获取。


02.
经过三方安全测试
Meta与微软联合推动Llama-2落地


人工智能在给社会带来巨大进步的同时,也伴随着风险。Meta希望提供开源,以促进大模型的透明度。

据Meta介绍,Llama-2已经通过安全测试。测试团队不但来自于Meta内部,通过生成对抗性提示以促进模型微调,还有第三方机构对Llama-2进行外部对抗性测试,以识别性能差距。

在Meta进一步的研究论文里,Meta解释了模型的微调和评估方法并指出了其缺点,并披露了此前经历过的已知挑战和问题。

Meta创建了大模型指南作为指引,以支持开发人员提供负责任的开发和安全评估的最佳实践。该指南概述了一些实践成果,反映了整个人工智能研究行业讨论有关负责任的生成式AI最先进的研究。

Meta还启动了一项新的合作伙伴计划,研究人员可以申请加入从业者社区,分享有关Llama-2的经验,社区将制定一个研究议程来推动未来的发展。同时,Meta还在政策监管下,明确禁止某些使用大语言模型的指导方向,以帮助确保这些模型得到公平和负责任的使用。


03.
结语:开源大模型
Meta加速AI领域发展


随着Meta大模型Llama 2发布,全球的大语言模型矩阵又新增一位重磅选手。Meta和微软的联合,也迅速将Llama 2的应用,直接和成千上万的开发者连接起来。

相较于上一代,Llama 2在推理、编码、熟练程度和知识测试,优于其他开源语言模型。

随着大模型研发和落地的加速狂飙,我们有望看到更多大模型为生活以及产业带来巨大影响。

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
开源大模型新SOTA!支持免费商用,比LLaMA65B小但更强,基于1万亿token钮祜禄·Meta:发布最强开源新模型Llama 2,拉拢微软做盟友|最前线Meta发布免费商用大模型 / 微信团队取消秋招/ iPhone 16 Pro Max拍照性能或大幅提升彻底开源,免费商用,上海AI实验室把大模型门槛打下来官方的Code Llama开源:免费商用,神秘版本接近GPT-4逼近GPT-4,AI编程要革命!Meta开源史上最强代码工具Code Llama更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了 |【经纬低调分享】北交大开源交通大模型TransGPT·致远,可免费商用全球首个可商用生物医药大模型BioMedGPT-10B开源改写游戏规则!Meta开源大语言模型Llama 2,可免费商用;微软Copilot定价每月每用户30美元 | 环球科学要闻尼日利亚的绑架犯罪社区服务是申请美国名校的必备条件吗?国产130亿参数大模型免费商用!性能超Llama2-13B,支持8k上下文,哈工大已用上更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了任何美好的期待,都可能落空百川开源最强中英文百亿参数模型!超越LLaMA,中国开源大模型开启商用新纪元性能超越Llama2-13B,可免费商用,姚星创业公司开源百亿参数通用大模型Meta被曝明年发布「开源版GPT-4级」全新大模型!参数量比Llama 2大数倍,可免费商用大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4ToolsMeta推出Llama2,免费可商用!Meta推出Llama 2,不只免费还可商用!其实有人欢喜有人愁……微软赢麻了!联合Meta 重磅发布开源、可直接商用大模型Llama 2,网友:OpenAI 感觉如何?印人念咒微软也搞起了开源小模型!利用OpenAI的ChatGPT和GPT-4 训练,实力碾压当前最强开源模型旷视恢复IPO注册程序;清华ChatGLM2-6B模型免费商用;传马斯克的xAI估值200亿美元丨AIGC大事日报AI版Office定价昂贵,微软“劈腿”Meta推大模型,免费且开源!GPT-3 计划开源!Sam Altman 自曝急缺 GPU,GPT-4 多模态能力明年开放开源大模型重击OpenAI!小扎放出LLaMA2炸裂科技圈,联手微软高通冲击市场格局GPT-4,Llama2,ChatGLM2,PaLM2共聚一堂 | LLM Day @KDD 2023大模型速度狂飙2.39倍!清华联手微软首提SoT,让LLM思考更像人类Meta“搞大事”了:发布GPT“平替”Llama 2,开源、免费、还可商用!GPT-3计划开源!Sam Altman自曝急缺GPU,GPT-4多模态能力明年开放负责任地说-退休, 我悔过国内首款开源交通大模型TransGPT(致远),可免费商用【公告】ChatGLM2-6B,免费商用
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。