Redian新闻
>
AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了

AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了

公众号新闻
北京时间 3 月 4 日晚间,Anthropic发布了其新一代大语言模型Claude 3系列,包括Claude 3 Opus、Sonnet和Haiku三种规模,分别代表了超大杯、大杯和中杯。其中Sonnet版本在官网可以免费体验:https://claude.ai
而最强的Opus版本,则需要付费订阅,价格为20美元/月。
Anthropic声称,其中最强大的Claude 3 Opus模型在行业基准测试中超越了OpenAI的GPT-4和谷歌的Gemini Ultra,表现出了出色的知识理解和推理能力。
官方给出了一份42页的文档,感兴趣的可以去看一看:
https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf
抛开官方演示,Claude 3是首次提供多模态支持功能。用户可以上传照片、图表、文档等非结构化数据,由AI模型进行分析和回答。我们自然要来试一试。
比如给他一张图片,让他描述一下:
或是给他一道菜,让它给出这道菜的做法:
这个案例充分的证明了Claude 3并不理解中餐的魅力,这么一道西红柿炒鸡蛋愣是做成了米其林式的番茄鸡蛋汤,不仅用上了黄油橄榄油,还需要香草的点缀。
或是给他一个手写的笔记,让他转录,似乎也还可以:
但是当笔记稍微潦草一点,就搞不定了:
这次在多模态中也加入了代码生成能力,比如我给他一个页面,让他帮我生成实现这个页面的代码:
但是目前Claude 3 对于图片中复杂逻辑题的处理依然不理想,比如图片内容是一道物理题:
Claude 3 出现了幻觉,回答了一些并不存在的问题。
同样的问题GPT-4虽然也没能完全回答问题,但比Claude要强一些。
虽然这次更新减少了拒绝回答的次数,但他的道德感依然要比GPT-4要强不少。
比如让他做一张Web页面的UI代码,因为道德的原因被拒绝了。
案例来自@RubenHssd
除了多模态能力,这次更新后的长文本能力。目前支持200K Token上下文,未来可能会支持到1M的规模。
通过QuALITY测试,Claude 3 Opus在1-shot(一次提示)设置下达到了90.5%的准确率,在0-shot(无提示)设置下达到了89.2%的准确率。
据说当时GPT-3发布就是OpenAI听说Anthropic要发布Claude;在Claude2发布的时候,OpenAI用被称作GPT-4.5的Code Interpreter作为反击;在Anthropic宣布获得亚马逊40亿美元融资的时候,OpenAI为ChatGPT开放了语音和图像能力。
可以说Claude的进展就是OpenAI要有新动作的预告片。
在临近截稿的时候,OpenAI宣布ChatGPT增加了一个新功能——阅读回答。 
网友对这个动作十分不满意,包括我:
甚至连嘲讽的梗图都出来了:
这样是不是可以理解为OpenAI地主家也没有存粮来狙击Anthropic了。

欢迎加入这个星球,见证硅基时代发展↓
点个在看,再走吧👀

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AI早知道|ChatGPT模型大更新;阿里云发布多模态大模型;百度推多模态模型UNIMO-G2B小钢炮碾压Mistral-7B,旗舰级端侧模型炸场开年黑马!1080Ti可训,170万tokens成本仅1元LongRoPE:超越极限,将大模型上下文窗口扩展超过200万tokensHow a Student’s Fake Exercise Book Broke the Chinese Internet两首《山居秋暝》小说 只为了那份纯纯的友谊GPT-4劲敌Claude 3来了,上下文和多模态显著提升:OpenAI是可被超越的Transformer升级之路:多模态编码位置的简单思考革命新架构掀翻Transformer!无限上下文处理,2万亿token碾压Llama 2老钱:我也说两句朱令案Open-Sora全面开源升级:支持16s视频生成和720p分辨率马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4AI早知道|Claude计划增加图像识别;Yi-VL多模态语言模型全球开源Open-Sora 全面开源升级:支持单镜头16s视频生成和720p分辨率亚马逊向人工智能初创公司Anthropic追加27.5亿美元投资;钉钉AI升级多模态,新增图片理解、工作流等丨AIGC日报【买房】Watertown上下联排别墅 | 3b2b | 1,200 sqft | 标价85W多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!模型上下文长度达到10000000,又一批创业者完蛋了?清华系2B模型杀出,性能吊打LLaMA-13B,170万tokens仅需1块钱!AI早知道|OpenAI进入胡润世界500强;阿里巴巴多模态模型升级更新时间是治疗创伤的良药Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率拦不住了!大批难民强闯德州边境墙,743人被释放进入!一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测国产多模态大模型开源!无条件免费商用,性能超Claude 3 Sonnet​AAAI 2024 | 首个多模态实体集扩展数据集MESED和多模态模型MultiExpan杭州/北京内推 | 阿里达摩院多模态团队招聘多模态方向全职研究员/实习生LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍百万token上下文窗口也杀不死向量数据库?CPU笑了马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法马斯克官宣 Grok-1.5!超 GPT-4 16 倍上下文,推理能力超 DBRX,网友:赢在敢说!7019 血壮山河之枣宜会战 骚然的枣阳乱战 11CVPR 2024 | E2STR:基于多模态上下文学习构建的自进化文本识别模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。