Redian新闻
>
OpenAI劲敌出手!Claude 3正式发布,超越GPT-4,一口气读15万单词

OpenAI劲敌出手!Claude 3正式发布,超越GPT-4,一口气读15万单词

公众号新闻

Claude3发布了,GPT-5还会远吗?


邓咏仪
编辑苏建勋

封面来源视觉中国

OpenAI创始人奥特曼都还没来得及和马斯克掰扯完新仇旧恨,没关系,还有其他人会悄悄出手——

北京时间3月4日晚间,Anthropic,毫无预警地发布了最新一代大模型Claude 3,距离上一代的Claude 2发布,仅相隔8个月。

Anthropic是OpenAI的劲敌,其核心团队同样是OpenAI的创业原班人马。团队因为与OpenAI理念不合而分家,于2021年成立了新公司Anthropic。

仅在2023年,Anthropic就连续获得五轮,共计73亿美元的融资。在大模型训练上,Anthropic可以说是业内第一梯队,同样备受硅谷关注。

这次,毫无疑问,Claude 3直接对标OpenAI当前最强大的模型GPT-4,多模态能力配齐,并且直接甩出超过46页的技术报告,自豪表示:

全面超越GPT-4!

来源|Claude

新一代的Claude 3分为三个版本,分别为Haiku、Sonnet、Opus三款模型。从模型尺寸来看,可以理解为模型的中杯、大杯、超大杯。

虽然Anthropic并没有给出模型的具体参数,不过给出了三款模型所适用的场景:

来源Claude

Haiku:是相应速度最快的模型,也是成本最低的选项,在大多数纯文本任务上的表现仍然相当出色,也同时包含多模态能力(比如视觉)

Sonnet:适用于需要平衡性能和成本的场景,它在纯文本任务上的表现与后面的Opus相当,但在成本上更为经济,适合于那些需要性能稍微好点,但预算有限的企业和个人用户

Opus:具有强大的推理、数学和编码能力,接近人类的理解能力,适用于需要高度智能和复杂任务处理的场景,如企业自动化、复杂金融预测、研究和开发等。

从本周开始,Claude会向159个国家开放。其中,Opus和Sonnet模型的API均已上线,开发者已经可以直接使用。经济性能兼顾的Sonnet,就在官网上提供免费体验,Opus则可供Claude Pro订阅者使用。

尽管OpenAI凭借Sora在文生视频领域打了一场漂亮的翻身仗,但视频赛道所在的发展阶段更早。如今的主战场仍在大语言模型(LLM)上,离产品化也更近。

圈内人也看热闹不嫌事大。近期不少报道显示,马斯克将OpenAI告上法庭,让OpenAI不得不内部推迟有关GPT-5的发布——GPT-5被认为能够实现AGI(通用人工智能)。著名AI圈网红、英伟达的首席AI科学家Jim Fan就表示:

Claude 3刚刚发布了,坐等几个小时后OpenAI精心安排的GPT-5发布。

来源|Twitter(X)

2024年才刚刚过去两个月,我们就已经见证谷歌Gemini Pro、OpenAI的Sora,再到如今的Claude发布……巨头混战再度拉开序幕,大有愈演愈烈之势。

一口气读15万单词,还能拆解复杂问题

如果是OpenAI是大模型领域的“六边形战士”,无论是模型视频、商业化综合水平一骑绝尘,那么Anthropic从风格上看更为低调,也更强调专才,但这次的能力提升确实巨大。

有看客甚至表示:

Claude 3终结了GPT-4时代。

这次Claude 3的两大更新亮点,一个是长文本,二是多模态能力。

长文本就是Anthropic的一个显著优势,体现为在读论文、小说等字数更多的文本时,Anthropic更擅长理解和回答用户的相关问题。

这次,Claude 3大大提升了上下文对话窗口,达到200k——可以理解为单次和模型对话能够输入的文本。

具体而言,Claude 3 200k的对话长度,相当于能够单次处理超过15万英文单词,而GPT-4 Turbo的上下文窗口为128k,大约是9.6万个英文单词。

并且,Claude 3也第一次允许图像和文档上传。和ChatGPT一样,Claude 3能够“认”出来图里的是什么东西,直接描述,回答用户的问题。

而更令人印象深刻的还是,Claude 3在分析一些复杂问题时,已经能够和人一样,先拆解问题,并且交由子模型来进行调度。

在Anthropic的演示视频里,就举了一个需要用python模拟经济形势走向的例子。当把“分析美国十年GDP未来趋势”的任务交给Claude 3之后,Claude就默默地做了这些事:

  • 先打开一个名为“webview”的工具,跳到这个问题相关的资料网址里
  • 因为有多模态能力,所以能够把“看到”的信息,无论是文字还是图表,都扒拉下来,用来解决问题
  • 然后自己写python程序、渲染趋势图,让人类看是否正确

最有趣的就是,网页中如果看到一个数据图表,没有明确数据的,Claude 3甚至能通过识别图像,来估算每个阶段大概数据是多少,进行还原。


搜索引擎中的数据图表


Claude 3还原的折线图,估算了每个时间节点的具体GDP

AI安全也是Anthropic区别于OpenAI的一点。在OpenAI和Anthropic团队分家的时候,其最重要分歧正是包含对AI安全的考虑,Anthropic希望建立一个“更可信”的模型,而OpenAI显然希望用商业化驱动模型更快地前进,路线上更为激进。

对此,Anthropic采取的措施包括但不限于:制定了一套框架,用于评估和减轻AI模型可能带来的潜在灾难性风险,比如继续拧自动化评估和红队测试,以确保AI不会发展出可能造成伤害的能力。

2023年4月,Anthropic甚至开源宪法人工智能(Constitutional AI)引起了圈内轰动,这是一个限制模型行为遵守特定宪法原则的AI。

以及2024年也是美国大选年,Anthropic也在准备开发和执行关于在政治和选举背景下使用工具的政策,评估模型对选举错误信息、偏见和其他滥用的反应,确保用户能够在选定国家获得准确和最新的投票信息。

不过,Anthropic也因为太过重视AI安全,很多问题的评估上很谨慎,甚至直接不回答,惹来一片用户吐槽。这次,Anthropic表示,Claude 3在这个问题上大有改进。

比如,Claude 3的对无害信息的拒绝回复率,普遍来到了10%附近,比Claude2.1和2.0都有进步。


来源Anthropic
据CNBC,Anthropic拒绝透露训练Claude 3到底花了多少时间和多少钱,但表示Airtable和Asana等知名SaaS公司有帮忙对模型进行了A/B测试,让模型的可控性也有所改善。

技术以外,Anthropic商业化还要再提速

尽管Anthropic技术上又一次拿出了看家实力,但大模型领域如今已经走过了一年多时间的技术竞争。如何从模型走向实际的产品落地,创造更大的商业价值,是悬在所有厂商头上的剑。

如今Anthropic背后站着谷歌云、亚马逊,已经和OpenAI(背靠微软)形成鲜明的阵营对比。但从商业化角度,当前Anthropic远赶不上OpenAI,这意味着Anthropic在2024年会面临更大压力。

和ChatGPT一样,Anthropic也是To B和To C两条腿走路。在企业侧,Anthropic已经服务了包括Slack、Notion和Quora等用户。

而据The Information2023年12月报道,Anthropic预计到2024年底将产生超过8.5亿美元的年化收入。相比起来,同样截至2023年底,OpenAI由于ChatGPT的强劲增长,年化收入从10月中旬的13亿美元就增至16亿美元。

往后,随着OpenAI商业化提速,差距还可能越来越大。The Information援引一些OpenAI领导者的观点,到2024年底,他们预计OpenAI年化收入可以达到50亿美元,而其他人则认为可以达到更高的数字。

技术上的军备竞赛远未结束。在2023年12月,Anthropic还在进行新一轮高达7.5亿美元的融资,估值为184亿美元,相比2023年初41亿美元的估值,涨了4.5倍。

独家、深度、前瞻,为1%的人捕捉商业先机

36氪旗下精选公众号

👇 真诚推荐你来关注 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测一口气读完《资本论》:解密资本主义运行规律,深刻洞察社会现象【杂纪】老人言快消外企社招 | Lagardère拉格代尔,世界三大旅行零售商之一,百年外企,平均月薪17.2k,0经验可投,留学生有优势突然爆火!超越GPT-4.0?这一产品引爆AI概念!飞行汽车延续涨势,昙花一现还是星辰大海...无神论是一种宗教对世界的看法形成的自圆其说的思想体系[宗]AI早知道|Anthropic推出Claude移动端App;OpenAI或将发布 ChatGPT 版搜索引擎英伟达 RTX 4080 SUPER GPU 跑分出炉:OpenCL 测试比非 SUPER 版高 7%今日arXiv最热NLP大模型论文:超越GPT-4,清华发布网页导航智能体AutoWebGLMiOS 17.3正式版发布:新增被盗设备保护功能/马云出手大幅增持阿里巴巴/腾讯旗下游戏公司大裁员Claude 3破译OpenAI邮件密文:人类未来掌握在「谷歌」手中!马斯克怒斥应改名ClosedAI通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5号称中文评测超越 GPT-4,百川智能发布超千亿参数大模型 Baichuan 3全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万字论文理解力接近人类|亮马桥小纪严选多领域文献阅读超越GPT-4!深势科技发布科学文献多模态大模型Uni-SMART技术报告5本让人一口气读到凌晨的小说,给作者跪了TikTok 花1500万元买30 秒“拉票”广告;史上最高金额:亚马逊27亿美元投向OpenAI劲敌丨Going Global超越GPT-4,Claude 3超大杯成新王!(古詩英譯)夜还东溪 王绩(唐)百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4我姐冬冬(十六)一口气读完《沙丘》 ,零一万物宝藏API正式开箱!酷炫Demo实测,多模态中文图表体验超越GPT-4V大模型新王诞生!Claude 3首次超越GPT4效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜神秘模型gpt2-chatbot实力被赞超越GPT-4:sam亲自确认,或是OpenAI全新模型OpenAI CEO称GPT-5发布前会发一批新产品;Airbnb前高管将加入OpenAI担任高管丨AIGC日报重磅!ChatGPT放大招!GPT Store应用商店今天上线!超300万GPTs,内卷之下的赚钱机会!Claude 3全面超越GPT-4?我们上手实测了一波。史上最强开源大模型 Llama 3正式发布。。。GPT-4劲敌Claude 3来了,上下文和多模态显著提升:OpenAI是可被超越的王小川旗下百川智能千亿大模型Baichuan 3,中文评测超越GPT-4;美国启动国家AI计划推动开放式AI研究丨AIGC日报马斯克、贝佐斯、比尔盖茨强推!敢不敢2024一口气读完这9本书拿到手一口气读了十几本,让孩子们打满分的传统故事Meta发布自我奖励机制,Llama在3轮训练后超越GPT-4forge a unique path with occasional dips, detours, and even dead
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。