国际科技财经博客移民网络热点娱乐民生时事公众号

>

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

公众号新闻

2024-03-27 07:03

鱼羊发自凹非寺
量子位 | 公众号 QbitAI

GPT-4真的被反超了！

大模型竞技场上，Claude 3大杯Opus新王登基，Elo分数来到榜首。

连小杯Haiku也跻身第二梯队，超过了GPT-4-0613这个型号，把GPT-3.5-turbo远远甩在身后。

Haiku的输入token价格，可是比GPT-3.5-turbo还便宜了一半，输出方面，每100万token也比GPT-3.5-turbo便宜近2块钱。

跟GPT-4相比，价格更是只有1/20。并且Haiku同样支持200k上下文。

难怪有开发者直言：

GPT-3.5在Claude Haiku面前不堪一击。
不仅仅是价格更便宜，Haiku还更上一层楼了。

而在Claude 3加入竞技之前，GPT-4家族已经霸榜快一年了。

给新来的朋友补充一下背景知识：大模型竞技场榜单（LMSYS Chatbot Arena Leaderboard）的评分标准是人类打分，同一个问题同时抛给A、B两个模型，人类裁判觉得哪个回答得好就给哪个投票。

小杯Haiku成开发者新宠

值得一提的是，在竞技场官方贺电中，Haiku这个型号也被专门高亮了出来：

根据我们的用户偏好，Claude 3 Haiku达到了GPT-4级别。
其速度、功能和上下文长度在目前的市场上是独一份的。

具体有多快，已经有网友做了个直观的对比：

博尔特还没跑完100米，Haiku已经读完100k token的文档了……

事实上，凭借其超高的性价比，在开发者社群中，Claude 3小杯Haiku确已成新宠。

已经有人第一时间大开脑洞，搞出了能让Haiku效果“超频”到大杯Opus水准的开源项目，吸引不少关注。

简单来说，就是让Opus给Haiku当老师：

先用Opus生成执行任务的范例，再用这些教学案例来提高Haiku的姿势水平。

划重点：Haiku的价格仅为Opus的1/60，而响应速度则是Opus的10倍。

这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。

还是这位马特老哥，还用Opus和Haiku搞了个“AI股票分析师”，直接火上了GitHub热榜。

不少应用产品也在第一时间接入了Haiku。比如能依据Prompt自动生成网站UI的Vercel。

△就说快不快吧

不过，就在一片给Claude 3新王点赞的声音中，也有网友认为：

GPT-3.5作为一个“老”模型，至今仍在与最新的模型竞争，这件事本身就很疯狂了。

但最让开发者们期待的当然还是：

OpenAI，快起来卷（doge）。

— 完 —

评选报名即将截止！

2024年值得关注的AIGC企业&产品

量子位正在评选2024年最值得关注的AIGC企业、 2024年最值得期待的AIGC产品两类奖项，欢迎报名评选！评选报名 截至2024年3月31日

中国AIGC产业峰会「你好，新应用！」已开启报名！点击报名参会同时，峰会将进行线上直播 ⬇️

点这里👇关注我，记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

大厂“平替”公司成求职新宠！公司人追求“工作性价比”神秘大模型一夜“征服”所有人，超GPT-4却无人认领？网友：OpenAI 要有大麻烦了黑马！大模型竞技场榜单更新，国产玩家首次进入全球总榜前10 上海率先打响AI开发者争夺战！大咖云集，先锋毕至｜ 2024全球开发者先锋大会 OpenAI CEO Sam Altman斯坦福闭门会！GPT-5将远超GPT-4！全面赶超GPT-4 ？阿里云发布通义千问2.5 国家安全部：太空不是相互博弈的竞技场苹果iOS 18将搭载生成式AI；谷歌Bard最新排名超GPT-4；百川发超千亿参数大模型Baichuan 3丨AIGC大事日报今日arXiv最热CV大模型论文：国产开源视觉大模型InternVL 1.5发布，赶超GPT-4V水准有了这个小窍门，可以做出奶白色的白菜炖豆腐汤中文创意写作能力超GPT-4，「最会写」的中文大模型Weaver来了闭源赶超GPT-4 Turbo、开源击败Llama-3-70B，歪果仁：这中国大模型真香【租房】市中心高性价比翻新红绿橙线Studio$2400包水热电 9/1起租 20分钟通勤BU MIT NEU 哈佛带无敌天台国产黑马大模型盲测竞技场挺进全球前十！中文榜和GPT-4o并列第一 OpenAI CEO最新演讲：GPT-5性能远超GPT-4；媲美Sora，视频生成模型EMO上线通义APP丨AIGC日报全球最强大模型一夜易主，GPT-4时代终结！Claude 3提前狙击GPT-5，3秒读懂万字论文理解力接近人类｜亮马桥小纪严选开源模型打败GPT-4！LLM竞技场最新战报，Cohere Command R+上线国产大模型评测超GPT-4！李开复：十年内不会套现全球顶尖AI研究者中国贡献26%；1320亿参数大模型开源；Anthropic大模型测评首超GPT-4丨AIGC大事日报大模型盲测竞技场放榜！国产黑马冲进世界七强，中文并列第一汉堡薯条加小杯饮料要24元？这家连锁快餐店引公愤回国散记：忽悠，骚操作阳光对打GPT-4！Claude 3秘密武器曝光：Claude宪法 GPT-4o成为全领域SOTA！基准测试远超Gemini和Claude，多模态功能远超GPT-4 14年前全款买的婚房变“烂尾”，外行“包工头”成开发商……这一地城改“黑洞”大揭秘钢琴事件中攀富的“英伦范”+阶层的区别拜登的2024竞选宣言被海信反超，小米电视的性价比模式失灵？｜焦点分析众包新玩法！LLM竞技场诞生基准测试，严格分离学渣学霸马斯克官宣Grok-1.5！超GPT-4 16倍上下文，推理能力超DBRX，网友：赢在敢说！Create 2024百度AI开发者大会：李彦宏带来三大AI开发工具，让人人都是开发者马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4 此时此刻 2024 一月27日早汉堡薯条加小杯饮料要$24元？这家连锁快餐店引公愤

热点事件追踪