Redian新闻
>
GPT-4发布,能击败90%的人类

GPT-4发布,能击败90%的人类

公众号新闻

"许多人工智能研究人员认为,整合文本、音频和视频的多模态系统为构建更强大的人工智能系统提供了最佳途径。





编辑| Tian

出品 | 青投创新

今天(315)凌晨,OpenAI布推出GPT-4这是其AI语言模型系列中最新的一款,为ChatGPT和新Bing等应用提供支持。


在OpenAI的介绍里,对GPT-4的描述是:这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型,将接受图像和文本输入,提供文本输出,虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平。


在Live Demo中,OpenAI的总裁和联合创始人Greg Brockman展示了GPT-4的能力:总结文章、写代码、报税、写诗等等,过去GPT-3.5做不到的, GPT-4都可以完成。


结论就是,GPT-4是一个比ChatGPT更加强大的模型!


01


强大在哪里?

“GPT-3.5和GPT-4之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。”


OpenAI首席执行官Sam Altman在推特上表示,过去的两年里,团队重建了整个深度学习堆栈,并与微软Azure一起,为GPT工作负载从头开始共同设计了一台超级计算机。经过训练和修复更新之后,GPT-4前所未有的稳定,成为OpenAI能够提前准确预测其训练性能的第一个大型模型。


GPT-4的改进明显体现在系统进行多项测试和基准测试中的表现,包括统一律师考试、LSAT、SAT数学和SAT基于证据的阅读和写作考试。


在美国律师执照统考模拟中,GPT-4得分约为前10%——击败了90%人类,而ChatGPT背后的GPT-3.5得分约为倒数10%;生物奥林匹克竞赛,GPT-3.5能达到后31%水平分位,GPT-4可达到前1%水平分位;GRE、SAT考试成绩中,也有大幅提升,击败了80%以上的人类答题水平,而医学知识自测考试准确率达75%。


尽管在GPT-4的介绍中,OpenAI没有像往常一样透露训练参数数据,只用了“更大的模型”来表述,但从GPT-4能完成的任务和表现来看,无疑是要比上一代GPT-3的1750亿个参数多很多倍。


并且GPT-4 由深度学习技术开发而来,是在公开可用和已被许可数据上进行的训练,并使用强化学习和人工反馈进行微调,这使得GPT-4相比上一代还接受了更多的训练,大幅提高数据与计算方面的能力。


GPT-4是多模态的,即不仅能接受图片、视频、音频的输入,还能同样输出图片、视频和音频。


许多人工智能研究人员认为,整合文本、音频和视频的多模态系统为构建更强大的人工智能系统提供了最佳途径。



02


存在的问题

OpenAI在发布GPT-4时强调,该系统已经进行了六个月的安全培训,并且在内部测试中,与GPT-3.5相比,GPT-4对禁止或不恰当内容做出响应的可能性降低了82%,做出实际响应的可能性提高了40%,这是对早期GPT模型皆会出现问题的一种修正:随意编造事实或触发敏感内容。


然而,这并不意味着系统不会出错或输出不恰当的内容。例如,微软透露其Bing搜索引擎一直由GPT-4驱动,许多用户能够以各种方式破解Bing的防护,让AI提供危险的建议,威胁用户,并编造信息。


而且GPT-4仍然是基于2021年9月之前的数据训练的,因此GPT-4还缺乏对2021 9之后数据的有效理解。


“GPT-4 仍有许多已知的局限性,我们正在努力解决,例如社会偏见、幻觉和对抗性提示。”OpenAI表示。



03


应用与竞争

OpenAI已经与多家公司合作,要将GPT-4结合到他们的产品中,包括Duolingo、Stripe和Khan Academy。


GPT-4模型也将以API的形式,提供给付费版ChatGPT Plus(OpenAI每月20美元的ChatGPT订阅)的订阅用户,开发者可以注册,用它打造应用。


微软此后表示,新Bing搜索引擎将运行于GPT-4系统之上。


OpenAI进一步强调,GPT-4“比以往任何时候都更具创造力和协作性,可以更准确地解决难题”。


与此同时,谷歌方面为了迎战微软,宣布将一系列即将推出的AIGC功能,应用到自家产品中,包括谷歌Docs、Gmail、Sheets和 Slides。


但不同于微软和OpenAI的“发布即可用”,谷歌只会先将Docs和Gmail中的AI工具,在月底提供给一些“值得信赖的开发人员”,而其它功能则将是在今年晚些时候向公众开放。


至于具体时间,谷歌方面并没有具体说明,外界对此评价是谷歌希望抢先微软原定于本周四的发布,但依旧让微软抢先了,所以将暂缓对公众对开放。


而国内的百度早先也宣布将在3月16日正式发布文心一言,但与谷歌面临的窘境一致,在OpenAI推出更加强大的GPT-4后,是否会对文心一言的发布有影响,还需明日揭晓。


美国伊利诺伊大学香槟分校计算机系教授李博表示,短期来看ChatGPT作为文章写作、代码生成的辅助查错工具还不错,但是还不能完全依赖ChatGPT来做回答和搜索,因为它的回答不能保证正确性。


长期来看,她认为ChatGPT可以和不同的AI模型工具结合,做更友好的自动问答系统、学习工具等辅助性工具。此外李博认为,如果要长久发展并用于重要领域中,ChatGPT的可信赖性保证、纠错能力等非常重要。

「往期推荐」


为什么是硅谷银行?

元宇宙倒在日落黄昏处

百度的“ChatGPT”文心一言还有机会吗?

正式发售NFT“旅行邮票”,星巴克瞄准元宇宙



END


欢迎全国各地以及境外科技产业及金融精英,寻找优质项目、资金及获得全球顶级金融圈层请联系Alex,或者在菜单中点击【青投服务】——>【服务登记】,留下您的需求我们将竭诚为您服务。




「青投创新」
青投创新,新型科创产业服务平台,以科技、人才、资本为核心,通过内容出版、数据支持、产业咨询、科技转化等业务,为科技人才创业项目提供孵化及加速赋能服务,助力国家科技兴国计划。

「青年投资家俱乐部」
青年投资家俱乐部汇聚来自金融机构、政府机构、上市公司、产业公司、三方服务的数万名专家资源。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
大变天!GPT-4发布:这些赛道会被打残上头条!全球考试拔尖,大温8岁华裔小学霸击败99%的考生GPT-4发布!谁能迭代ChatGPT?还得是OpenAI自己GPT-4发布后,这届AI真的“杀疯了”GPT-4发布后,其他大模型怎么办?Yann LeCun:增强语言模型或许是条路8点1氪:​GPT-4发布,考试中击败90%的人类;腾讯会议再次调整,将取消免费300人不限时会议;海底捞禁止单点清水锅消息属实西医的先天困境:俺来为层出不穷的西医医药事故“洗地”GPT-4.0对战GPT-3.5:GPT-3.5简直弱爆了!!!一战成名!美女主播转行当基金经理,收益率竟击败97%同行...用GPT打败GPT?AutoGPT将AI进程推向了新高度!|GGViewGPT-4来了!10秒钟做出一个网站,考试中击败90%的人类,OpenAI付款系统被挤爆ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇Gpt 4一出,谁与争锋GPT-4发布后,我离失业还有多远太强了!GPT-4发布,全面吊打ChatGPT重磅!GPT-4 正式发布,新版 ChatGPT 强到离谱,我们替你抢先体验了二年级选课,忽闻一夜 GPT 来,千课 万课 AI 开考试能力超90%的人类!OpenAI重磅发布GPT-4,支持这些功能→人言为信,知止有定:灌水有感月入五千,能不能击败95%的人勇敢与钢铁GPT预防癌症的10大举措-我能做到几个?美女主播惊艳转身基金经理,击败97%的日本同行GPT-4发现LeCun「小秘密」,一大波测评来袭:别问我是谁,我是GPT-3!GPT-4发布!太太太太强了!早财经丨突发!美军称无人机被俄击落,俄方回应;GPT-4发布!考试超过90%人类;华为辟谣开发芯片堆叠方案GPT-4重磅发布,吊打ChatGPT!性能炸天:10秒做出一个网站,在考试中击败90% 人类最新GPT-4在律考中击败90%人类,它到底强在哪?韦神出的这道题火了,GPT刚刚!GPT-4发布!太太太太强了!GPT-4 震撼发布,能读图,考高分,训练更高效GPT-4 重磅发布,吊打 ChatGPT!太太太强了!击败90%的人类,更聪明更强大的GPT-4来了史上最强?GPT-4发布,百度明天压力大了集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布ChatGPT最新测评发布,超半数美国人无法区分人类写作与机器写作为什么所有公开的对 GPT-3 的复现都失败了?复现和使用 GPT-3/ChatGPT,你所应该知道的2023再访巴黎:Respirer Paris
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。