开源Llama 3.1一夜成最强大模型!超越闭源GPT-4o,OpenAI坐不住了
夕小瑶科技说 原创
作者 | 海野
万众期待的开源模型Llama3.1终于走官方渠道上线了。
我们昨天已经领略过Llama3.1(偷跑版的)威名:
Llama3.1共包含8b、70b和405b三种模型,它们都有惊人的128k最大上下文。究其性能,405b模型在通识、数学、翻译等一系列方面,都能小压GPT-4o一头,与Claude 3.5 sonnet不分伯仲。
要知道,GPT-4o和Claude3.5都是闭源模型啊!而Llama3.1宣传的核心就是:开源,开源,还是开源!
正如Meta的CEO扎尔伯格致辞所述:
开源是AI前进的方向。
我们相信,开源将确保世界上更多的人,能领略使用人工智能的优势和机会,权力将不会集中在少数人手中,并且人工智能技术可以在社会中更公平、更安全地落地。这就是为什么我们一直致力于开源,让开源人工智能成为行业标杆。
这里我真的很想cue一下OpenAI:你们还是赶紧把名字改成CloseAI吧!
AI大神Andrej Karpathy对Llama3.1赞不绝口,他很喜欢扎尔伯格的开源AI生态设想,接下来会针对Llama3.1模型的微调做一些视频。
Yann Lecun也对Llama3.1进行了夸赞:Meta AI正迅速成为使用最广泛的AI助手。
战火升级:OpenAI提供免费的gpt-4o Mini微调
而这时候,OpenAI终于沉不住气了……
就在Llama3.1遭泄露后,OpenAI发布了一则推文,讲述他们如何为AI安全付诸努力。
也许这篇推文本身与Llama没有关联,它发布的时间也只是“恰好”与Llama3.1发布撞车了。但我们回看过去,在其他大厂的AI模型发布重大更新的前一天,OpenAI总会横插一脚发布ChatGPT的新版本。
这次有网友猜测:OpenAI也许是在嘲讽开源模型安全性的问题。
更有意思的是,OpenAI的这篇推文,在评论区迎来了一片骂声:我们需要你创新AI,而不是监管AI。
而针对Llama3.1发布,OpenAI又采取了另一种手段:
在9月23日前,OpenAI向tier4和tier5用户提供2m个免费tokens,来使用定制的GPT-4o mini。这个福利预计会逐步扩大到所有用户都能享受。
但是评论区又出现了戏剧化的一幕:
有一位网友分享了自己微调后的Llama3.1 8b模型测试,吊打GPT-4o mini。
这下,这篇推文换来的也是一片嘲声了。
话说回来,在昨天疑似Meta员工的账号泄露Llama3.1模型后,有没有跟我一样,就是觉得:
员工手误提前一天泄露了Llama3.1,也是Meta宣传手段的一环的呢?(划掉)
不过这也有可能是防止抢热度的反制手段。如果OpenAI抢在Llama3.1前一天公布新的AI,Meta可以通过这种偷跑的方式,防止OpenAI背刺。
现在我们来看,Llama3.1无疑是从技术层面,还是宣传层面,都取得了成功。
作为一个顶尖开源模型,它代表着世界上更多的人会有更多的机会,去深耕,去探索世界,去融汇知识,利用开源AI,我们可以将人工智能带来的福利,传递给世界上每个人。不止极客,不止你我,而是全社会。
微信扫码关注该文公众号作者