Redian新闻
>
史上最强!全球首个“开源GPT-4”出世!

史上最强!全球首个“开源GPT-4”出世!

科技

今天(4月19日),美国科技巨头 Meta 推出了 Llama 3,号称「有史以来最强大的开源大模型」,外部开发者可直接免费使用。

在外界看来,Meta现在推出Llama 3,是为了追赶行业领导者OpenAI。

但Meta首席执行官扎克伯格向外媒表示,“我们的目标不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。”

01
性能最好开源模型
正是冲GPT-4来的

很显然,Meta此次推出Llama3,正是冲着GPT-4来的。

作为追赶努力的一部分,Meta一直在发布像Llama 3这样的模型供开发人员免费商业使用,因为强大的免费模型的成功可能会阻碍竞争对手从其专有技术中赚取收入的计划。

扎克伯格表示,由于预训练和指令微调,Llama 3相比Llama 2有了极大的改进。

其主要亮点大都集中于:模型架构、预训练数据、预训练规模、指令微调。

如相较Llama 2,Llama3的训练集规模扩大了7倍、代码数据量增加了4倍,训练效率提升了大约3倍。

简单来说,Llama3目前有两个版本:8B版本和70B版本。

按 Meta官方的说法,这两个版本是目前同体量下,性能最好的开源模型。近期也将登陆主要的云供应商。

其中,70B版本具备超4000亿参数,将直接对标GPT-4;而8B版本在某些测试集上,性能比上一个版本的Llama 2 70B 还要强。

此外,8B 参数评测结果碾压 Gemma-7B、Mistral-7B 版本;而 Llama 3 70B 版本评测结果同样也在诸多成绩上超过了 Gemini 1.5 Pro 和 Claude 3 Sonnet。

从AI领域大佬们的反馈来看,Llama 3此次表现确实不同寻常。

AI三巨头之一的杨立昆(Yann LeCun) 专门为 Llama 3 发了一个帖子,马斯克则现身该评论区,留下一句“Not bad”

人工智能和机器学习领域国际上最权威的学者之一、AI开源倡导者吴恩达则表示:“Llama 3的发布是自己这辈子收到过的最好的礼物,谢谢你Meta!”

02
正式版Llama 3
或将于7月发布

在未来几个月内,Meta 或会推出更多版本。

英伟达高级科学家 Jim Fan 认为,之后可能会发布的 Llama 3-400B 以上版本,这或将成为某种“分水岭”,开源社区可能即将能用上 GPT-4 级别的模型。

Meta也在官方博客中明确指出,未来几个月内将推出的Llama3正式版本将具备“多模态”特性,即同时驾驭文本与图像生成。

但有知情人士透露,研究人员还未对Llama3进行细致的微调工作,所以尚未决定Llama 3是否将是多模态模型。

微调是模型开发过程中至关重要的一步,通过向现有模型注入额外的数据,使其能够习得新的知识或适应特定任务需求。通常情况下,参数量更大的模型能够产生更高质量的输出,而较小的模型则以快速响应见长。

如果说的再详细点,Meta 还计划推出新功能、更长的上下文窗口、额外的模型尺寸和增强的性能,并且将分享 Llama 3 的研究论文。

有消息称,正式版的Llama 3 将会在今年7月推出。

03
扎克伯格绑定谷歌
抗衡OpenAI和微软

扎克伯格在本月初,还向投资人表示,今年的主要关注领域包括推出Llama 3和“扩大Meta AI助手的实用性”。

所以,除了发布Llama 3,Meta还宣布与Alphabet旗下的谷歌达成一项新的战略合作伙伴关系。

此次合作,将使Meta的AI助手在回答用户问题时,可以实时融入来自谷歌搜索的权威结果,这也是对现有与微软必应合作的有效补充。随后,Meta AI助手正在扩展到美国以外的十多个市场,包括澳大利亚、加拿大、新加坡、尼日利亚和巴基斯坦。

扎克伯格周四在发布会上称,Meta AI是“你可以自由使用的最智能的人工智能助手”。他表示,最大版本的Llama 3目前正在用4000亿个参数进行训练,在MMLU(大规模多任务语言理解)测试中得分为85分。他表示,推出的两个较小版本现在分别有80亿个参数和700亿个参数,后者MMLU的得分为82分。

目前,Meta已将Llama 3模型集成到 Meta AI 中,官方认为这是世界上领先的 AI 助手。网页版已同步上线:meta.ai,用户登录后即可保存与 Meta AI 的对话记录。

据介绍,用户可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI 来完成任务、学习、创造。

04
开闭源之争再加剧
周鸿祎回怼李彦宏

开源和闭源之争,渐渐演变成一场宗教般的信仰之争,很难有人保持中立。

不久前,在百度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏称,“以前说开源便宜,其实在大模型领域,开源是最贵的。所以开源模型会越来越落后。”

此前,李彦宏在内部讲话时也提到,开源模型很难实现众人拾柴火焰高;同等能力下,闭源在成本上反而更有优势;闭源会持续领先,而非一时领先;闭源才有真商业模式,能赚到钱才能聚集人才和算力。

对此,360集团创始人周鸿祎在第二十七届哈佛中国论坛上,疑似回怼李彦宏:

“我一直相信开源的力量,至于网上有些名人胡说八道,大家也别被他们忽悠,说开源不如闭源好。”

“一句话,今天没有开源就没有Linux,没有Linux就没有互联网,就连说这话的公司自己都借助了开源的力量才成长到今天。”

“源社区聚集的工程师和科学家的数量是闭源的数百倍。所以,今年开源只做了一年就已经超过了GPT-3.5的能力。未来一两年内,开源的力量很有可能会达到或者超过闭源的水平。”

周鸿祎还举例说,“前两天百度的李彦宏说他们的大模型超过了GPT-4,然后王小川不相信,就出来怼李彦宏。其实你仔细听听李彦宏说的是有道理的,他是说在写古诗方面,百度超过了GPT-4”。

近期,原搜狗创始人、现百川智能创始人王小川,在接受媒体采访时犀利吐槽:李彦宏很魔幻主义,去年2月就喊出比OpenAI只差两个月,已经够有幻觉了。

在国外,AI三巨头之一的杨立昆Yann LeCun认为,科学论文、代码的自由交换以及AI训练模型的公开共享使美国在科学技术领域保持领先地位。这个理念并非新颖,很久以前就有了。

开源实现了对访问的民主化。它让更多的人和企业有能力利用最先进的技术,并弥补潜在的弱点。这也有助于促进民主价值观和制度,减少社会差距并改善竞争。

而来自麻省理工学院和剑桥大学的科学家们在一篇论文中提到,发现开源大模型的确可能存在被不良行为者操纵的风险。Anthropic 公司研究人员也曾发表论文警告称,AI中毒可能导致开源大模型变成潜伏的间谍。

05
写在最后

今天有媒体这样写道:

相比国内外的开闭源之争,更重要的是,在一次次的更迭中,我们站在科技变革的门槛上,得以窥见AI技术已不再是冰冷的算法和数据堆砌,而是拥有了多元感知能力和精准的社会理解。它预示着,未来的人工智能将更深入地融入我们的生活。

这样的融入,也许在开源与闭源的辩论声中,显得有些暗淡。但在此刻,听到不同的声音和立场,感受技术进步带来的激烈碰撞,也许才是科技本身的意义。

最后,关于大模型开源与闭源之争,你有哪些看法?




近期原创 关注阅读


华为突然开售:“秒没”!

极越员工买小米SU7被强制开除?官方刚回应

重磅!李彦宏最新内部讲话曝光

华为,重大发布!
刚刚,武大宣布新设雷军班!
罕见!马云再发声
字节跳动利润疯涨60%,首次超越腾讯?官方回应
网传Zara要撤出中国市场?官方回应来了
贾跃亭国内最后一笔巨额资产即将被抵债
18.9亿元!陆正耀被强制执行的原因,有人猜到了
OpenAI 这一招,直接要了谷歌半条命!
刚刚,Sora首部MV正式亮相!

独家丨周鸿祎x朱啸虎:没10亿美金闲钱,别碰通用大模型

刚刚,贾跃亭发文批小米汽车!

2024黑马AI培训战略发布:让中小企业AI梦照进现实

牛文文:企业AI化是“人工智能+”的关键一步

AI融入千行百业!《2024中国十大AI产业应用》榜单正式发布

刚刚,加拿大鹅宣布裁员17%!

飞书宣布裁员!或将涉及1000人
宣布为iPhone16提供AI功能后,百度股价大涨6%!

关于AI落地“最后一公里”,这里有30条前沿洞察

反击“棺材”风波10天后,李想选择了认错

奥特曼首次公开回应:GPT-5、AGI、马斯克、内斗
投资人眼里的AI革命:寻找应用层的黄金机会


加入黑马 一起AI
↓↓↓


联系我们

转载开白或商务合作:15222191516  
与主编交流沟通:chenfu3721
i黑马,创业黑马旗下媒体,让创业者不再孤独
业黑马 媒体矩阵 推荐关注
↓↓↓

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o开源日报 | 离职后可以删除自己所写的软件吗;国产开源笔记本电脑在深圳发布;全球首位AI程序员爆火全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用不用再等 OpenAI ,全球首个 Open-Sora 全面开源!微软一夜干翻苹果!史上最强AI PC诞生,全面整合GPT-4o,能对话,还能教你打游戏向Redis宣战?微软开源Garnet,性能提升几十倍!果家今天发布M4芯片加持,再次“史上最强 iPad Pro”。还有新iPad air和pencil pro。买买买!OpenAI有望在今年夏季推出GPT-5;英伟达推出更强GPU芯片;马斯克宣布正式开源Grok-1|AIGC周观察第三十七期最强开源大模型 Llama 3震撼发布!开源模型将追上GPT-4,4000亿参数模型也在路上张若虚的另外一首诗阿里云突然发布全球最强开源模型 Qwen2,性能超越美国最强开源模型清华开源全球首个基于U-ViT的多模态扩散大模型UniDiffuserAI进化太快了,马斯克开源Grok-1,爆火!史上最强开源大模型 Llama 3正式发布。。。中国最强地级市,只有更强,没有最强!两次击败那英,歌坛最强00后横空出世!网友:竟还是个理科学霸!?全球首个符合汽车功能安全开源OS方案发布,助推软件定义汽车加速详解Latte:去年底上线的全球首个开源文生视频DiTAI成功改写人类DNA:全球首个基因编辑器开源;浙江大学首次实现汉字书写脑机接口,“意念写字”成现实丨AIGC日报美股基本面 - 2024_02_19 * 午报 * 胡塞武装击中一艘英国货轮,红海航线持续紧张。以色列说巴西总统为“不受欢迎的会写代码的总理!全球第一“开源”名门望族全球瞩目!中国'骁鸿'芯片,横空出世!巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数|ICLR 2024开源日报 | 微软AI程序员登场,马斯克开源Grok;Open-Sora全面开源会写代码的总理!全球第一 “开源” 名门望族全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万字论文理解力接近人类|亮马桥小纪严选说到做到,马斯克开源Grok,3140亿参数免费可商用马斯克开源Grok-1,OpenAI如何应对?|【经纬低调分享】别等OpenAI了,全球首个类Sora抢先开源!所有训练细节/模型权重全公开,成本仅1万美元双林奇案录第三部之校园疑案: 第七节“上海”不会过期AI成功改写人类DNA,全球首个基因编辑器震撼开源!近5倍蛋白质宇宙LLM全生成性能直逼 GPT-4!最强大的免费开源模型出世 | 极客时间萁豆相煎:皇家子弟的宿命?公布秘密邮件、指控OpenAI沦为微软子公司…马斯克状告奥特曼,要求开源GPT-4!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。