Redian新闻
>
颤抖吧!GPT-4有多强:AP考试5分,SAT 1410分,通过美国律师资格测试!

颤抖吧!GPT-4有多强:AP考试5分,SAT 1410分,通过美国律师资格测试!

教育

先来看一组震撼人心的考试成绩

  • 美国律师资格考试298分通过,超过90%考生
  • SAT 1410分,这还是数学只拿到700的前提下
  • AP艺术史、生物、微观宏观经济学、心理学、统计、美国历史等考试中全部顺利拿到5分


当你以为这是哪位优秀毕业生的成绩时,OpenAI公司告诉你,这只是GPT-4能力的冰山一角

美国当地时间3月14日中午,OpenAI官宣最新的GPT-4已经到来。部分Plus用户已获得使用权限,同时API申请通道也已经开启。

在很多人还在学习ChatGPT 3.5的时候,GPT-4就这么横空出世,惊掉众人下巴。那么,它到底有哪些新的超能力呢?

01
GPT-4的最新特性

OpenAI发布的最新语言模型GPT-4,是目前最大的语言模型之一,拥有约1.5万亿个参数,比前一版本GPT-3大了近10倍(1750亿参数)!

GPT-4最大的特点是其多模态能力,能够同时处理文本和图像,并在两种媒体之间进行转换和协调。这意味着它不仅可以生成文本,还可以生成图像,或根据文本生成图像,或根据图像生成文本。这种能力让GPT-4可以应用于许多场景中,如小说、漫画、音乐、电影等。

GPT-4的图片理解能力令人震惊

在一些专业和学术的基准测试中,GPT-4表现出了明显超过GPT-3.5的水平


以MMLU为例子。MMLU旨在通过在零样本和少样本的情况下评估模型,来衡量模型在预训练过程中获取的知识。这使得MMLU测试更具挑战性,也更接近于评估人类的方式。MMLU测试包含了57个主题的14000个多项选择题2,涵盖了自然科学、社会科学、艺术、人文等领域。MMLU测试还支持多种语言,可以用来评估模型的跨语言能力。

那么GPT-4的表现如何?

简而言之,GPT-4的得分远远超过前辈GPT-3.5的表现,顺便暴打了GOOGLE旗下的PaLM模型,并且GPT-4在多语言场景下都有不俗的表现。

在OpenAI Playground网站上,用户可以与GPT-4进行交互,并选择不同的模式和主题生成文本或图像。此外,还有GPT-4 News、GPT-4 Art、GPT-4 Code、GPT-4 Chat等其他应用和演示。

02
ChatGPT还有没有竞争对手?

就像是约好了一样,目前市面上最有潜力的2位竞争者——PaLMClaude也在美国时间3月14日发布了重磅更新:
  • Anthropic公司正式发布Claude,是目前最直接的ChatGPT竞争对手
  • 谷歌旗下的PaLM也在当天正式宣布,开放PaLM的API权限,用于商业和开发用途。截止发稿前还没有公布具体定价

Claude是Anthropic发布的人工智能聊天机器人。在市场应用方面,Claude展现出了惊人的潜力,已经被Quora、Juni Learning、Notion、DuckDuckGo和Robin AI等公司使用,以提供各种服务,比如聊天、辅导、生产力、助手和法律合同评估。Calude的正式公布,意味着Anthropic正式进入下场跟OpenAI拼刺刀的环节。而有趣的是,组建Anthropic最早的元老成员,正是20年底从OpenAI离职的多位核心成员。

相比热火朝天的ChatGPT和明星模型Claude,知道PaLM的人并不多。但在大语言模型这个领域里,PaLM同样鼎鼎大名。

PaLM是Google发布的一种大型语言模型,最大特点是它的双向能力,也就是它可以根据上下文来生成任意位置的文本,并且可以对文本进行编辑和修改。这意味着PaLM不仅可以生成文本,还可以改写文本,或者根据用户的要求来增加或删除文本中的某些部分。这种能力让PaLM可以应用在很多场景中,比如创作文章、诗歌、歌词等。

另外,还有百度即将推出的文心一言大语言模型,将在3月16日(也就是本文发布的当天)举行发布会,表现也十分令人期待!

03
用GPT-4可以玩出了哪些花样?
除了前面提到的鸡块地图,在过去的12小时里,网友们疯狂展示着对GPT-4的训练成果。

我能说很多人类都不见得能准确解释槽点么

网友:下一步直接用片子+GPT-4来进行医学诊断?

再加上具体的食谱,拍张照就能变成厨神?!

在官方演示视频中,主讲人通过一张手画的网页草图,就让GPT-4生成了相应的HTML代码,这可比上一代用自然语言处理需求更加令人惊讶,说明GPT-4的图片识别能力已经相当完善。


GPT-4到底还有多少潜力?GPT-5又将什么时候到来?而ChatGPT的竞争对手们面对来势汹汹的GPT,将会如何继续出招?让我们拭目以待,一起体验真正意义上的“日新月异”!





微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
手慢无!2023年医师资格考试《实践技能考官手册》免费领北京娘们,真牛!阿里版ChatGPT已进入测试!中文聊天截图曝光,达摩院出品托福考试全新改革:时长缩短!2023年AP考试在即牢记事项“话痨”聊天机器人,居然通过美国名校MBA考试?这是要逼疯投行?报考要求严苛,考试难度增加!卫生资格考试要尽快通过!颤抖吧!熬夜侠参加美国律师考试,为什么要穿成人纸尿裤?美丽的地方:“青蛙居住之地”今夜,基金“爆了”!颤抖吧股民,幻方宣布大消息!韦神出的这道题火了,GPT中医药就是吃饭喝水,夜宿早起ChatGPT通过美国医师考核!能代替医生看病吗?我们做了个有趣测试震撼!GPT-4来了,支持多模态,全面吊打ChatGPT,完虐标准化考试颠覆投行!?ChatGPT通过宾大沃顿MBA考试!AI有多强?ChatGPT轻松通过沃顿商学院MBA考试下雨了我就在家里练练手!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!GPT-4变更强了!新版ChatGPT律师考试赢9成考生哪种咖啡最能代表你?咖啡人格测试限时免费中,快来!89%美国大学生竟用ChatGPT写作业?实测轻松通过斯坦福和宾大沃顿期末考试!高盛性格测试"内幕", 留学生都被骗惨了!迪丽热巴好惨!好莱坞如临大敌!颤抖吧人类!匹兹堡记事 - 2022.12.26 伊利湖边的海鸥2023医师资格考试现场审核汇总!Gpt 4一出,谁与争锋颤抖吧股民!AI炒股要来了,量化巨头全力以赴!马斯克也憋不住了,成立新公司加入AI大战!ChatGPT要取代医生?我拿通过美国执医测试的它试了试中国的……FastTrack Universität 2023莱比锡大学公立语言项目招生简章GPT厉害!GFG铁路公司公布无人驾驶列车照片,通过多伦多只需90秒!二年级选课,忽闻一夜 GPT 来,千课 万课 AI 开超强!最新版ChatGPT高分通过美医师资格考 数秒诊断出罕病每日原则:了解如何使用和解读人格测试复旦放大招,国内首个类ChatGPT大模型开放测试!《流浪地球》MOSS照进现实【科技】医生要失业了?ChatGPT几乎通过了医师执照考试!ChatGPT全球赛开场,李彦宏已无退路,百度文心一言今日正式开始邀请测试!ChatGPT通过美国医学执照考试,科技如何重构大健康产业火爆私校的6-18岁少儿电脑编程课免费领!藤校师资,科技竞赛AP考试大满贯!请教申请什么学校
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。