Redian新闻
>
Meta发布首个开源可商用LLM,硬刚OpenAI和谷歌两大巨头

Meta发布首个开源可商用LLM,硬刚OpenAI和谷歌两大巨头

科技
出品 | OSC开源社区(ID:oschina2013)
Meta 和微软深度合作,正式推出下一代开源大语言模型 Llama 2,并宣布免费提供给研究和商业使用。
Llama 2 论文地址:https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/
据介绍,相比于 Llama 1,Llama 2 的训练数据多了 40%,上下文长度是 Llama 1 的 2 倍,并采用了分组查询注意力机制。具体来说,Llama 2 预训练模型是在 2 万亿的 token 上训练的,微调 Chat 模型是在 100 万人类标记数据上训练的。
Meta 称 Llama 2 在许多外部基准测试中,包括推理、编码、熟练度和知识测试中,都超过其他模型表现。
Llama 2 包括 Llama 2 和 Llama 2-Chat,包含了 70 亿、130 亿和 700 亿参数 3 个版本,其中 Llama 2-Chat 针对双向对话进行了微调,并且跟 ChatGPT 类似, Llama 2-Chat 也经历了预训练阶段 (PT)、指令微调 (SFT) 以及人类反馈强化学习 (RLHF) 三个阶段。
Meta 表示 Llama 2 可免费用于研究和商业用途,开发者们可以直接在 Llama 2 官方网站下载该模型。
地址:https://ai.meta.com/resources/models-and-libraries/llama-downloads/

BTW,根据 Llama 2 的授权政策,如果企业的月活用户数超过 7 亿,则必须从 Meta 申请许可证。Meta 会对此类授权进行严格设限。


为了防止此前 LLaMA 泄漏后带来的深度伪造和色情聊天机器人等不良信息和产品的出现,Llama 2 已经过红队测试,避免模型产出不良和有害内容,并且为开发者们制定了使用指南和守则。
Meta 发布首个开源可商用大语言模型的举动,无疑是在硬刚 OpenAI 和谷歌两大巨头。毕竟 OpenAI 的 GPT-4 和谷歌的 PaLM 2 走的都是 “技术保密路线”。Meta 首席科学家、图灵奖获得者 Yann LeCun 认为,Meta 此举可能将改变大模型行业的竞争格局。
扎克伯格还在 Facebook 上发帖表示:“Meta 有着悠久的开源历史,开源推动创新,它让更多开发人员能够使用新技术进行开发,同时提高了技术的安全性。我们相信如果生态系统更加开放,将会带来更多进步,这就是我们开源 Llama 2 的原因。”
话说回来,微软现在左拥 Meta,右抱 OpenAI,这不是妥妥的脚踏两条船吗?
相关链接:
  • https://ai.meta.com/llama/
  • https://ai.meta.com/blog/llama-2/
  • https://www.facebook.com/zuck/posts/pfbid02j7TCKZHRe1X4K3DA7EdA96q6Cx7DS3ZixKyrqsyx7NvUwx9X88V18nnqLF3BAsXjl


往期推荐



CentOS 项目宣称 “向所有人开放”
微软推出新的默认字体Aptos替代Calibri,网友:I、l终于能分清了
微软:Rust安全可靠,Windows内核加大力度使用



这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
BELLE-7B-1M逆袭ChatGLM?10B量级开源中文对话LLM,谁成常识问答任务的黑马?小说连载 《四维空间的魔鬼与人类起源》-- 02国产语音对话大模型来了:李开复零一万物参与,中英双语多模态,开源可商用开源打败闭源?Meta即将推出开源代码生成平台Code Llama,剑指OpenAI CodexMeta发布大规模视觉模型评估基准FACET!开源视觉模型DINOv2允许商用首个可商用的32k上下文开源大模型「长颈鹿」来了,两万词长文不在话下Meta“搞大事”了:发布GPT“平替”Llama 2,开源、免费、还可商用!Meta被曝明年发布「开源版GPT-4级」全新大模型!参数量比Llama 2大数倍,可免费商用微软赢麻了!联合Meta 重磅发布开源、可直接商用大模型Llama 2,网友:OpenAI 感觉如何?王小川大模型25天再升级!13B版本开源免费可商用,3090即可部署回。首Offspring of Spirit阿里大模型又开源!能读图会识物,基于通义千问7B打造,可商用BELLE-7B-1M逻辑推理超预期?10B量级开源中文对话LLM,谁最「懂」逻辑推理?可商用多语言聊天LLM开源,性能直逼GPT-432k上下文可商用!羊驼进化成长颈鹿,“开源大模型之最”OpenAI 和谷歌最怕的,是一张"开源笑脸" |【经纬低调分享】开源打败闭源?Meta 即将推出开源代码生成平台 Code Llama,剑指 OpenAI Codex小说连载 《四维空间的魔鬼与人类起源》-- 03改写游戏规则!Meta开源大语言模型Llama 2,可免费商用;微软Copilot定价每月每用户30美元 | 环球科学要闻Instacart估值大跳水!仅为之前零头;Meta挑战OpenAI和谷歌,计划发布新AI模型谷歌创始人正式回归,加入LLM大战!指导Gemini研发,与OpenAI、Meta混战一触即发Meta推出Llama 2,不只免费还可商用!其实有人欢喜有人愁……全球首个可商用生物医药大模型BioMedGPT-10B开源ETH等提出思维图(GoT)超越思维链(CoT): 用LLMs解决复杂问题!增强版开源Llama2 终可商用;5G消息真的要来了,工信部最新通知;微软英伟达市值一夜飙升1750亿美元 | AIoT情报传OpenAI秘密训练GPT-5;腾讯混元大模型或本周亮相;首个中英语音多模态LLM开源不用LLM,遗传编程可控Python代码!谷歌DeepMind等提出全新ARZ框架|IROS 2023Meta推出Llama2,免费可商用!650亿参数大模型预训练方案开源可商用!LLaMA训练加速38%,来自明星开源项目马斯克硬刚OpenAI,用户惨遭池鱼之殃小说连载 《四维空间的魔鬼与人类起源》 01爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯免费、可商用,阿里云开源70亿参数通义千问大模型中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。