Redian新闻
>
Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

公众号新闻
鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

GPT-4真的被反超了!

大模型竞技场上,Claude 3大杯Opus新王登基,Elo分数来到榜首。

连小杯Haiku也跻身第二梯队,超过了GPT-4-0613这个型号,把GPT-3.5-turbo远远甩在身后。

Haiku的输入token价格,可是比GPT-3.5-turbo还便宜了一半,输出方面,每100万token也比GPT-3.5-turbo便宜近2块钱。

跟GPT-4相比,价格更是只有1/20。并且Haiku同样支持200k上下文。

难怪有开发者直言:

GPT-3.5在Claude Haiku面前不堪一击。

不仅仅是价格更便宜,Haiku还更上一层楼了。

而在Claude 3加入竞技之前,GPT-4家族已经霸榜快一年了。

给新来的朋友补充一下背景知识:大模型竞技场榜单(LMSYS Chatbot Arena Leaderboard)的评分标准是人类打分,同一个问题同时抛给A、B两个模型,人类裁判觉得哪个回答得好就给哪个投票。

小杯Haiku成开发者新宠

值得一提的是,在竞技场官方贺电中,Haiku这个型号也被专门高亮了出来:

根据我们的用户偏好,Claude 3 Haiku达到了GPT-4级别。

其速度、功能和上下文长度在目前的市场上是独一份的。

具体有多快,已经有网友做了个直观的对比:

博尔特还没跑完100米,Haiku已经读完100k token的文档了……


事实上,凭借其超高的性价比,在开发者社群中,Claude 3小杯Haiku确已成新宠。

已经有人第一时间大开脑洞,搞出了能让Haiku效果“超频”到大杯Opus水准的开源项目,吸引不少关注。

简单来说,就是让Opus给Haiku当老师

先用Opus生成执行任务的范例,再用这些教学案例来提高Haiku的姿势水平。

划重点:Haiku的价格仅为Opus的1/60,而响应速度则是Opus的10倍。

这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。

还是这位马特老哥,还用Opus和Haiku搞了个“AI股票分析师”,直接火上了GitHub热榜。

不少应用产品也在第一时间接入了Haiku。比如能依据Prompt自动生成网站UI的Vercel。

就说快不快吧

不过,就在一片给Claude 3新王点赞的声音中,也有网友认为:

GPT-3.5作为一个“老”模型,至今仍在与最新的模型竞争,这件事本身就很疯狂了。

但最让开发者们期待的当然还是:

OpenAI,快起来卷(doge)。

评选报名即将截止!

2024年值得关注的AIGC企业&产品

量子位正在评选2024年最值得关注的AIGC企业、 2024年最值得期待的AIGC产品两类奖项,欢迎报名评选评选报名 截至2024年3月31日 

中国AIGC产业峰会「你好,新应用!」已开启报名!点击报名参会 同时,峰会将进行线上直播 ⬇️


点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
最新!GPT-5已有客户上手体验:性能炸裂!或将在夏天发布【Fenway studio首选】【高性价比 + 半中介费】小米汽车计划2月量产;美国AI企业一天蒸发1.3万亿市值;开发者用ChatGPT与超过5000位女性「约会」 | 极客早知道此时此刻 2024 一月27日早上海率先打响AI开发者争夺战!大咖云集,先锋毕至 | 2024全球开发者先锋大会马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!2024Niche全美学术最佳大学排名发布!耶鲁登顶!春节将至,澳或迎移民购房潮!多个华人区房价飙升,这区年涨幅32.9%登顶!专家预计:降息前增势将放缓!Bun 为 JavaScript 和 TypeScript 开发者提供了一个跨平台的 Shell汉堡薯条加小杯饮料要24元?这家连锁快餐店引公愤中文创意写作能力超GPT-4,「最会写」的中文大模型Weaver来了堪比无间道!香港金牌卧底被判刑23年!背后原因令人哗然…拜登的2024竞选宣言有了这个小窍门,可以做出奶白色的白菜炖豆腐汤全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万字论文理解力接近人类|亮马桥小纪严选GPTs大翻车后,OpenAI再宣布给开发者送钱!美国码农狂欢市区 Loop 房源L03 | Studio$19xx, 1b$24xx/不收中介费/性价比最高的湖景公寓开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线【2024全新翻新公寓6-9月排位开始啦!超高性价比NEU,伯克利同学实现步行上学|Studio$1950起享受高级公寓的物业】Chelsea超高性价比公寓|Studio - 2b2b|2500+|免半年停车苹果iOS 18将搭载生成式AI;谷歌Bard最新排名超GPT-4;百川发超千亿参数大模型Baichuan 3丨AIGC大事日报Create 2024百度AI开发者大会:李彦宏带来三大AI开发工具,让人人都是开发者回国散记:忽悠,骚操作奥特曼专访自曝全新GPT-5细节:性能跃升超想象,算力足可达AGI!被海信反超,小米电视的性价比模式失灵?|焦点分析不要再谈性价比了,质价比时代已经到来钢琴事件中攀富的“英伦范”+阶层的区别马伯庸新书,美食X权谋X悬疑,[hào]吃有多了不起?Kubernetes:kube-scheduler 源码分析马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报汉堡薯条加小杯饮料要$24元?这家连锁快餐店引公愤无中介费|随时入住|Commonwealth Ave上近BU步行5分钟高性价比Studio租金1950+,包水暖。Chelsea性价比高级公寓|免一月房租和6月停车位|Studio - 2b2b阳光
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。