Redian新闻
>
Meta表示Llama 3击败了包括Gemini在内的大多数其他人工智能模型

Meta表示Llama 3击败了包括Gemini在内的大多数其他人工智能模型

公众号新闻

点击蓝字 关注我们

SUBSCRIBE to US


Illustration by Nick Barclay / The Verge


该公司在一篇博客文章中表示(https://ai.meta.com/blog/meta-llama-3/),Meta的下一代大型语言模型Llama(https://www.theverge.com/2024/4/18/24133808/meta-ai-assistant-llama-3-chatgpt-openai-rival)将向AWS等云提供商和Hugging Face等模型库发布,其性能优于大多数当前的人工智能模型。


Llama 3目前有两个模型权重,分别为8B和70B参数(包含80亿参数的Llama 3 8B和包含700亿参数的Llama 3 70B。)。到目前为止,它只提供基于文本的响应,但Meta表示,这是对前一版本的“重大飞跃”( https://ai.meta.com/blog/meta-llama-3/)。Llama 3在回答提示方面表现出更多的多样性,拒绝回答问题的错误拒绝更少,而且可以更好地推理。Meta还表示,Llama 3比以前理解了更多的指令,编写了更好的代码。


Meta在帖子中声称,在某些基准测试中,两种尺寸的Llama 3都击败了谷歌的Gemma和Gemini(https://www.theverge.com/2024/2/21/24078610/google-gemma-gemini-small-ai-model-open-source)、Mistral 7B和Anthropic的Claude 3等尺寸相似的型号。在通常衡量常识的MMLU基准中,Llama 3 8B的表现明显好于Gemma 7B和Mistral 7B,而Llama 2 70B的表现略好于Gemini Pro 1.5(https://www.theverge.com/2024/2/15/24073457/google-gemini-1-5-ai-model-llm)。


(值得注意的是,Meta 2700字的帖子中没有提到OpenAI的旗舰机型GPT-4。)


还应该注意的是,基准测试人工智能模型虽然有助于了解它们的强大程度,但并不完美(https://www.theverge.com/2024/4/15/24131097/measuring-ai-models-needs-an-overhaul)。用于对模型进行基准测试的数据集已被发现是模型训练的一部分,这意味着模型已经知道评估人员会问它的问题的答案。


Screenshot: Emilia David / The Verge


Meta表示,人类评估人员对Llama 3的评分也高于其他模型,包括OpenAI的GPT-3.5。Meta表示,它为人类评估人员创建了一个新的数据集,以模拟可能使用Llama 3的真实世界场景。这个数据集包括一些用例,如征求建议、总结和创造性写作。该公司表示,研究该模型的团队无法获得这些新的评估数据,也不会影响模型的性能。


Meta在其博客文章中表示:“该评估集包含1800个提示,涵盖12个关键用例:征求建议、头脑风暴、分类、封闭式问题回答、编码、创造性写作、提取、角色/伪装、开放式问题回答,推理、重写和总结。”


Llama 3有望获得更大的模型尺寸(可以理解更长的指令和数据串),并能够做出更多的多模式响应,如“生成图像”或“转录音频文件”。Meta表示,这些较大的版本参数超过400B,理想情况下可以比较小版本的模型学习更复杂的模式,目前正在训练中,但初步性能测试表明,这些模型可以回答基准测试提出的许多问题。


不过,Meta没有发布这些大型模型的预览,也没有将它们与GPT-4等其他大型模型进行比较。


微信号|IEEE电气电子工程师学会

新浪微博|IEEE中国

 · IEEE电气电子工程师学会 · 


人工智能如何帮助抵御网络攻击

人工智能引领数据中心发展新趋势

汽车知晓你的信息?解读隐私与安全挑战

汽车成为信息时代的移动计算机:5大数据收集方式解析

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Meta期待减少人工智能技术限制女校长涉嫌诈骗近5000万后投江自尽!其母在内的29名受害人将其父等告上法庭这国一直升机坠毁,国防军司令在内的10名高级指挥官死亡!总统召开紧急会议……美股基本面 - 2024_02_24 * 午报 * 伯克希尔Q4净利润同比翻倍 投资收益近300亿美元 现金储备创纪录。一图看软银将斥资1500亿日元增强人工智能算力;泰国批准奇瑞建电动汽车工厂丨智能制造日报最新民意调查:大多数美国人希望修建边境墙,80%的人表示移民危机是一个“严重问题”英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑雷军、周鸿祎两会力挺大模型,隔壁印度GenAI却要被谷歌Gemini“扼杀”?宇宙人(1484期)同比增长5.3%;国家天文台人工智能工作组发布大模型“星语3.0”​;刘强东数字人今天将开启直播首秀清华成立颠班,比姚班还牛逼!网友:他人笑我太疯癫,我笑他人看不穿玫瑰饼香满屋香港智能城市,科技及AI人工智能落户千百业的应用AI早知道|Apple 发布 MM1多模态大语言模型;xAI 是市场上薪酬最高的人工智能公司人工智能提振微软业绩,大公司押注人工智能遭审查李飞飞团队发布《2024年人工智能指数报告》,预测人工智能未来发展趋势台湾人林先生从文字模型到世界模型!Meta新研究让AI Agent理解物理世界中国工业互联网研究院:人工智能大模型工业应用准确性测评报告EMBA管理智库 | 生成式人工智能时代,你的职业锚在哪里AI早知道|Kimi智能助手升级;Meta开源推出新一代大语言模型Llama3QS前100英国大学发布:最新24fall硕士申请截止日期!商科、人工智能部分专业已截止!上海期智研究院全球招人才!人工智能/信息安全/量子智能方向的来上岸笔记 | 恭喜 美本 Aggie同学 成功斩获 Bellwether Asset Management,全职offer分布式人工智能盛会 DAI 2024 征稿:Agent Day,数十顶会级别会议报告,Jim Fan 将出席!离家的路李彦宏:开源模型会越来越落后;Adobe探索与OpenAI合作,增加人工智能视频工具丨AIGC日报【荐】人工智能时代,AI已经替代了大多数工作,孩子未来怎么办?华为相关人士辟谣P70预售,苹果或用百度人工智能,通义千问可处理千万字文档,微信回应朋友圈横线,这就是今天的其他大新闻!The Man Who Accidentally Created TikTok’s Biggest Meme上海期智研究院诚聘人工智能、信息安全、量子智能及相关方向海内外顶尖人才苹果的人工智能野心可能包括谷歌或 OpenAI半数企业主认为ChatGPT比学位更重要,Meta发布免费人工智能模型Llama 3《魅羽活佛》第369章 光头与光头《留学》环球资讯:JHU公布24Fall新生录取画像,教育部发布4项行动助推人工智能赋能教育贝叶斯数学与人工智能相结合 可使太阳能更智能
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。