史上最强！全球首个“开源GPT-4”出世！

科技

2024-04-19 08:04

今天（4月19日），美国科技巨头 Meta 推出了 Llama 3，号称「有史以来最强大的开源大模型」，外部开发者可直接免费使用。

在外界看来，Meta现在推出Llama 3，是为了追赶行业领导者OpenAI。

但Meta首席执行官扎克伯格向外媒表示，“我们的目标不是与开源模型竞争，而是要超过所有人，打造最领先的人工智能。”

性能最好开源模型

正是冲GPT-4来的

很显然，Meta此次推出Llama3，正是冲着GPT-4来的。

作为追赶努力的一部分，Meta一直在发布像Llama 3这样的模型供开发人员免费商业使用，因为强大的免费模型的成功可能会阻碍竞争对手从其专有技术中赚取收入的计划。

扎克伯格表示，由于预训练和指令微调，Llama 3相比Llama 2有了极大的改进。

其主要亮点大都集中于：模型架构、预训练数据、预训练规模、指令微调。

如相较Llama 2，Llama3的训练集规模扩大了7倍、代码数据量增加了4倍，训练效率提升了大约3倍。

简单来说，Llama3目前有两个版本：8B版本和70B版本。

按 Meta官方的说法，这两个版本是目前同体量下，性能最好的开源模型。近期也将登陆主要的云供应商。

其中，70B版本具备超4000亿参数，将直接对标GPT-4；而8B版本在某些测试集上，性能比上一个版本的Llama 2 70B 还要强。

此外，8B 参数评测结果碾压 Gemma-7B、Mistral-7B 版本；而 Llama 3 70B 版本评测结果同样也在诸多成绩上超过了 Gemini 1.5 Pro 和 Claude 3 Sonnet。

从AI领域大佬们的反馈来看，Llama 3此次表现确实不同寻常。

AI三巨头之一的杨立昆（Yann LeCun）专门为 Llama 3 发了一个帖子，马斯克则现身该评论区，留下一句“Not bad”。

人工智能和机器学习领域国际上最权威的学者之一、AI开源倡导者吴恩达则表示：“Llama 3的发布是自己这辈子收到过的最好的礼物，谢谢你Meta！”

正式版Llama 3

或将于7月发布

在未来几个月内，Meta 或会推出更多版本。

英伟达高级科学家 Jim Fan 认为，之后可能会发布的 Llama 3-400B 以上版本，这或将成为某种“分水岭”，开源社区可能即将能用上 GPT-4 级别的模型。

Meta也在官方博客中明确指出，未来几个月内将推出的Llama3正式版本将具备“多模态”特性，即同时驾驭文本与图像生成。

但有知情人士透露，研究人员还未对Llama3进行细致的微调工作，所以尚未决定Llama 3是否将是多模态模型。

微调是模型开发过程中至关重要的一步，通过向现有模型注入额外的数据，使其能够习得新的知识或适应特定任务需求。通常情况下，参数量更大的模型能够产生更高质量的输出，而较小的模型则以快速响应见长。

如果说的再详细点，Meta 还计划推出新功能、更长的上下文窗口、额外的模型尺寸和增强的性能，并且将分享 Llama 3 的研究论文。

有消息称，正式版的Llama 3 将会在今年7月推出。

扎克伯格绑定谷歌

抗衡OpenAI和微软

扎克伯格在本月初，还向投资人表示，今年的主要关注领域包括推出Llama 3和“扩大Meta AI助手的实用性”。

所以，除了发布Llama 3，Meta还宣布与Alphabet旗下的谷歌达成一项新的战略合作伙伴关系。

此次合作，将使Meta的AI助手在回答用户问题时，可以实时融入来自谷歌搜索的权威结果，这也是对现有与微软必应合作的有效补充。随后，Meta AI助手正在扩展到美国以外的十多个市场，包括澳大利亚、加拿大、新加坡、尼日利亚和巴基斯坦。

扎克伯格周四在发布会上称，Meta AI是“你可以自由使用的最智能的人工智能助手”。他表示，最大版本的Llama 3目前正在用4000亿个参数进行训练，在MMLU(大规模多任务语言理解)测试中得分为85分。他表示，推出的两个较小版本现在分别有80亿个参数和700亿个参数，后者MMLU的得分为82分。