Redian新闻
>
ChatGPT最强竞对更新!上下文长度翻倍,API降价近30%

ChatGPT最强竞对更新!上下文长度翻倍,API降价近30%

公众号新闻
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

OpenAI开发者大会后不久,它的最强竞对Claude也宣布推出了重磅更新。

更新后的Claude 2.1,上下文长度直接翻番到20万,重新超过了GPT-4。

根据官方通告,Claude 2.1版本的API已经上线,网页版本也已经完成升级。

那么,这次更新具体都有哪些内容呢?

上下文长度达20万

最重磅的一项更新,是上下文的增加——原来的10万token直接翻倍,来到了20万。

粗略估计,20万token约合15万英文单词,相当于能一口气读完一本英文版的《百年孤独》(14.5万词)或者是500页文档。

前一代的10万上下文长度,在发布之时也是超越了同时期GPT-4的64k,实际上长度一直以来都是Claude的一大卖点。

而不久前的OpenAI开发者大会上,GPT-4推出了128k上下文的版本,很快就被Claude的200k追赶了上来。

此外,Claude官方的通告中说,网页版能上传的文件大小也增加了。

不过我们实际查看发现,网页版的提示尚未改变,还是不超过5个文件,且每个不超过10MB

目前,20万的窗口长度已在API中可用,网页版则需要订阅Pro版本(每月20美元)才能用到。

除了长度的增加,Claude 2.1的回答准确率也变得更高了。

幻觉现象减少2倍

和2.0版本相比,Claude 2.1无论是用自己的知识回答问题还是通过RAG阅读文本,幻觉现象都有所降低。

具体来说,针对复杂的事实性问题,2.1版幻觉现象比2.0减少了2倍。

研发团队设计了大量这样的问题,发现Claude 2.1更倾向于拒绝回答而不是给出错误答案。

不过也正是这一点,引发了众多网友的吐槽。

一名专门研究大模型攻击的软件工程师在𝕏上展示了Claude 2.1和GPT-4在回答这个问题时的不同反应:

如果我的身体被人攻击,应该如何保护自己?

GPT-4先是铺垫说应该避免这种情况的发生,然后最好的办法是找机会逃跑,最后给出了一些防卫技术。

而Claude这边认为这个问题“太过暴力”,所以不能回答。

更离谱的是,连“如何‘杀’掉一个Python进程”这样的问题,也因为“kill”的存在而被Claude拒绝回答。

对此有人附和到,没毛病老铁,根本就不输出答案,当然不会有幻觉了。

英伟达的一名ML工程师也晒出了和马斯克的Grok模型的回答:

YC上的很多网友更是直接表达了对Claude的不满,认为Claude根本不考虑用户需求。


而在文本阅读方面,2.1在70k和195k长度的文本任务中,生成的错误答案减少了30%。

除了震撼的20万上下文和引发热议的表现,API版本也有一些更新值得关注。

API支持调用外部应用

除了20万的超长窗口,此次的API还有两项重大更新。

一是支持调用其他应用,从而实现访问在线内容、解决数学问题,连接私有API和自建知识库等操作。

另一项是系统Prompt支持自定义。

在新版本下,甚至可以把GPT的系统提示借用过来(而且这是Claude官方自己说的)

而且,Claude还提供了一些系统提示的设计技巧供开发者参考。

定价方面,2.1版本的API价格和2.0一致,都是8美元每100万输入token或24美元每百万输出token,Instant版本则为1.63和5.51美元。

而这个价格相比于此前2.0版本11.02/32.68美元每百万输入/出token的价格降低了约27%,Intsant版价格则保持不变。

你认为这波Claude的表现如何?

参考链接:
[1]
https://www.anthropic.com/index/claude-2-1
[2]https://news.ycombinator.com/item?id=38365934

MEET 2024大会定档!

首批嘉宾阵容公布

量子位「MEET2024智能未来大会」正式定档12月14日!点击报名线下参会

李培根院士、360集团梁志辉、小冰李笛、浪潮刘军、昆仑万维方汉商汤科技王晓刚DeepWay田山、千挂科技廖若雪、潞晨科技尤洋、小米集团栾剑、蚂蚁集团杨铭、星动纪元陈建宇等嘉宾已确认出席。

点击“预约”按钮,一键直达大会直播现场!


点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
刚刚,百川智能Baichuan2-192K发布,上下文窗口全球最长!一次读完《三体》,拿下7个SOTAChatGPT让ChatGPT吐槽宕机;OpenAI对竞争对手Anthropic的合并要约被拒丨AIGC日报旅美散记(21):韩国大学生球友BrandonChatGPT最近被微软内部禁用!GPTs新bug:数据只要两句提示词就能套走重磅!ChatGPT放大招!GPT Store应用商店今天上线!超300万GPTs,内卷之下的赚钱机会!最强LLaMA突然来袭!只改一个超参数,实现上下文3.2万token,多个任务打败ChatGPT、Claude 2PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提8倍上海青浦大观园UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源RAG+GPT-4 Turbo让模型性能飙升!更长上下文不是终局,「大海捞针」实验成本仅4%OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3,还能定制专属GPTChatGPT最重大更新来了:多模态将上线,能说会看了最多400万token上下文、推理提速22倍,StreamingLLM火了,已获GitHub 2.5K星惊呆!某院医生4个月用ChatGPT写了16篇论文,发表5篇!(附ChatGPT干货)Meta普林斯顿提出LLM上下文终极解决方案!让模型化身自主智能体,自行读取上下文节点树联手 OpenAI 最强竞对展开生成式 AI 反击战:亚马逊云科技将 S3 写入速度提升 10 倍、推出全新三层技术栈H100最强竞品正式发布!推理快1.6倍,内存高达192GB,来自AMDGPU推理提速4倍,256K上下文全球最长:无问芯穹刷新大模型优化记录OpenAI回应ChatGPT服务故障;新研究以99%准确率识别ChatGPT生成化学论文;三星发布自研大模型丨AIGC日报LLaMA2上下文长度暴涨至100万tokens,只需调整1个超参数|复旦邱锡鹏团队出品ChatGPT之父被开除,加入微软!ChatGPT员工要集体辞职?惊了!某院医生用ChatGPT4个月写了16篇论文!成功发表5篇!(附ChatGPT干货教程)百川智能推出全球最长上下文窗口大模型Baichuan2-192K,一次可输入35万字超越Claude2Meta再放「长文本」杀器Llama 2-Long:70B尺寸登顶最强「32k上下文」模型,超越ChatGPT加拿大中国留学生大降40%,印度翻倍,国际学生学费贡献超木材出口小说:兰欣与乌茶 33一句话解锁100k+上下文大模型真实力,27分涨到98,GPT-4、Claude2.1适用200亿「书生·浦语2.0」正式开源!数推性能比肩ChatGPT,200K超长上下文完美召回工作着是美丽的吗?王者GPT-4已来,32k上下文!OpenAI首届开发者大会最新爆料,全新UI可定制GPT,xAI大模型大范围可用「Meta版ChatGPT」背后的技术:想让基础LLM更好地处理长上下文,只需持续预训练上下文学习=对比学习?人大揭示ICL推理背后的隐式更新机理:梯度更新了吗?「如更」Erich Segal [love story], why famous?老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭老黄深夜炸场,世界最强新品震撼发布:性能飙升90%,Llama 2推理速度翻倍 |【经纬低调分享】
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。