Redian新闻
>
GPT-4携手微软炸场,百度“文心一言”面世,差距在哪里?

GPT-4携手微软炸场,百度“文心一言”面世,差距在哪里?

公众号新闻



你是否想过,给AI发一张搞笑的照片,它能get到笑点,并且与你幽默地交流。你甚至可以把它作为一个虚拟对象进行交流倾诉。


你是否想过,给AI发一张食材的照片,它能够正确识别图片里的东西并且推断这些原料能够制作的菜,甚至为你提供相关菜谱。


甚至有一天,它能解放打工人的双手,帮助打工人生成文档、电子邮件和幻灯片。


这些,AI现在都能做到。


当地时间2023年3月14日, OpenAI宣布大型语言模型的最新版本GPT-4问世。GPT-4是一个大型多模态模型,可以接受图像和文本输入并产生文本输出,相较于GPT-3.5,它能够识别和分析图像。


OpenAI表示,他们创建了GPT-4,这是OpenAI在努力扩展深度学习方面的最新里程碑。


01

GPT-4强大在哪里?


GPT-4经过迭代更新后,拓展学习了广泛的知识,具备了更好的问题解决能力,能够更精确地处理复杂问题。


#GPT-4更可靠、更具创造性

GPT-4比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑、迭代创造性的、技术性的写作任务,例如创作歌曲、编写剧本或是学习用户的写作风格。


用一个句子描绘灰姑娘故事的情节,并且使用的单词开头必须按照A-Z的顺序,并且不重复任何字母。GPT-4表现出了超高的创造性。



#GPT-4的视觉输入

GPT-4可以接受文本和图像的提示符,并能与纯文本设置并行,允许用户指定任何视觉或语言任务。


GPT-4会接受图像作为输入,识别图像并生成说明、分类、分析。


比如这个图片

GPT-4不仅能够识别鸡蛋、面粉等原料,还能根据图片内容推荐制作相应的食物。


它甚至能看懂梗图

问GPT-4:这张图有什么好笑的?

GPT-4:用过时的大型VGA充现代智能手机iphone


能进行图表分析

GPT-4可以算格鲁吉亚和西亚人的人均每日肉类消费。


能做物理题


能理解照片中不对劲的地方


能看懂漫画




#GPT-4更可靠,在推理和语言能力方面比ChatGPT更先进

在比较简单的问题上,GPT-3.5与GPT-4的差别不是很大。但当任务足够复杂时,GPT-4会比GPT-3.5更可靠,能够处理更细微的指令。


让两个模型进行不同内容的考试和复杂的推问题,GPT-4这位“同学”能够在考试中表现得更好。


除此之外,GPT-4在除了英语的其他语言上的能力也十分强大。研究团队让GPT-4将涵盖了57个主题的14000个多项选择题翻译成多种语言,在测试的26种语言中,GPT-4在24种语言翻译中优于GPT-3.5。


#可操纵性

开发人员以及相关用户可以在“系统”消息中规定人工智能的风格和任务,而不是固定的冗长、平静经典的风格特征,系统消息允许用户在一定范围内自定义用户体验。


#处理更长的内容

GPT-4能够处理超过25000个单词的文本,能够进行长篇内容创作、更延展的对话以及查找分析资料。


02

各方态度


#微软

当地时间3月16日,微软举办了一场AI发布会,宣布推出名为Microsoft 365 Copilot的人工智能服务,将嵌入Word、PowerPoint、Excel等Office办公软件中,帮助用户生成文档、电子邮件以及幻灯片等。


微软董事长兼首席执行官萨蒂亚·纳德拉(Satya Nadella)称,“这是我们在计算交互方面迈出的重要一步,这将从根本上改变我们的工作方式,并开启新的生产力增长浪潮。”


除此之外,在正式发布前,GPT-4就已经为微软公司的新必应(New Bing)提供支持。



#谷歌

就在GPT-4发布的前几个小时,谷歌发布博文,宣布推出AIGC功能应用到办公软件中。但不同于OpenAI发布即可用,谷歌先提供给值得信赖的开发人员,其他功能则在晚些时候向公众开放。



#百度

在GPT-4发布的一天之后,百度全新一代知识增强大语言模型“文心一言”正式发布。该模型具备文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成五种能力。它与GPT-4有着类似的监督精调、RLHF和提示构建技术,在知识、检索和对话增强技术方面则突出百度特色。


此外,苹果、Meta和亚马逊等公司也在计划重新评估人工智能的开发策略。



03

相关应用


#为视觉障碍人士提供技术帮助

丹麦初创公司Be My Eyes从2012年开始就一直在为超过2.5亿盲人或低视力人群提供技术支持。


现如今有GPT-4的支持,它可以像志愿者一样需要视觉辅助人士,与他们聊天,分析并回答用户提供的图像和提出的问题,提供即时的视觉帮助。例如,GPT-4可以帮助需要视觉辅助的人访问比较混乱的购物和商务网站,帮助他们进行阅读搜索,提供比较正确的购买决定。


Be My Eyes首席执行官Michael Buckley表示:“在我们访问的短时间内,我们看到了任何图像到文本的对象识别工具都具有无与伦比的性能。这对全球无障碍环境的影响是深远的。在不远的将来,盲人和低视力群体将利用这些工具不仅满足大量视觉解读需求,而且在生活中拥有更大程度的独立性。”


#为语言学习人士提供练习帮助

GPT-4能为语言学习人士提供练习和纠错的帮助。3月14日,语言学习软件多邻国宣布,他们将利用OpenAI的GPT-4,在一个名为DuolingoMax的新订阅中推出两个新功能,扮演人工智能对话伙伴和“解释我的答案”。


角色扮演功能可以让用户身临其境地进行交流对话。得益于GPT-4,多领过能够指导用户完成不同场景的对话。例如点餐、第一次见面或购买机票等经典场景。


人工智能一直是我们战略的重要组成部分,”首席产品经理Edwin Bodge说道。“我们一直在使用它来个性化课程和进行Duolingo英语测试。但在学习者的旅程中,我们想填补一些空白:对话练习和对错误的上下文反馈。”


“解释我的答案”功能则能让用户能深层次了解分析自己的答案。有了GPT-4对错误内容的反馈的支持,用户可以了解正确答案或是明确错误产生的原因。


多邻国团队看到了GPT-4提供比以往任何时候都更有效、更具吸引力的学习体验的潜力,这将在一定程度上改善学习者的学习成果。


#更好的总结审查服务

Stripe是一个流行的支付网关平台,帮助企业和个人处理国际支付事务。该公司已经开始使用GPT-4。

Stripe表示,GPT-4可以更好地了解用户业务,并比人工审查人员更好地扫描网站以获得工作摘要。该公司的开发人员说,更新后的模型可以很容易地理解用户的问题,突出重要的部分,总结解决方案,甚至阅读十分详细的文档。

该公司还使用GPT-4分析社交媒体Discord上帖子的语法,以标记可疑账户,扫描入站通信并识别协同攻击。


除此之外,GPT-4具备能组织庞大的知识库,为学生定制个性化的课程,保护某个地区、国家的语言、文化和历史等功能。


04

局限性


尽管经过迭代更新,GPT-4的功能已经非常强大,但它仍然存在与早期GPT模型类似的风险,即仍然不完全可靠。它存在社会偏见,产生幻觉(模型编造了不存在的或错误的事实),生成错误答案,出现推理错误等。


GPT-4在输出中可能存在各种偏差。OpenAI的目标是让人工系统具有合理的默认行为,反映广泛的用户价值观,允许系统进行私人定制和确定界限,但GPT-4暂时还不能达到这样的水平。


其次,GPT-4缺乏对绝大多数数据中断后发生的事件的了解,并且不能吸取经验教训。有时它会犯一些简单的推理错误,或是在过于轻信用户明显的虚假陈述。除此之外,它可能难以处理棘手的问题,例如在它生成的安全代码中引入安全漏洞。


除此之外,GPT-4在预测方面也会出现差错,出错在于没有仔细检查工作。


05

存在的风险


GPT-4仍然存在与以前模型类似的风险,例如生成有害的建议、产生错误的代码或是不准确的信息。


OpenAI与50多位专家合作,根据更多用户的反馈,进一步对GPT-4的行为、安全性和监测系统进行改善。总的来说,通过干预,GPT-4增加了引发不良行为和反馈的难度。但仍然存在一些“越狱”的行为,违反了使用指南的内容。随着人工智能系统升级和风险的增加,这些干预措施和实现极高可靠性变得至关重要。


GPT-4和后续模型有可能以有益和有害的方式对社会产生重大影响。OpenAI正在与外部研究人员合作,以改进对潜在影响的理解和评估方式,并对未来系统中可能出现的危险能力进行评估。

06 国内相关产品的差距在哪里?


自2022年12月ChatGPT发布之后,无论是一级市场,还是国内外的大厂,都在发力大模型,研发类ChatGPT产品。百度也跟紧步伐,于2023年3月16日推出“文心一言”产品。


但事实上,国内的相关产品与GPT-4之间有着比较大的差距。“文心一言”在问答问题的准确性、灵活性、多样性上仍有提升空间,相较于GPT-4还稍显生硬和模式化。


而差距拉大的背后,是人才、资金投入和技术积累的差距。过去十几年里百度一直在AI方面投入,包括2019年推出文心大语言模型。2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。 


但是,百度和OpenAI还有不小差距。李彦宏也表示,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。因为深度学习、自然语言处理,需要多年的坚持和积累,没法速成。 


王晟曾指出,中国的ChatGPT们即便奋起直追,静态来讲两三年能追上就已经是乐观情况。但如果对方一直进化,且进展速度远比追得速度要快,那么可能永远都追不上。直到对方遇到瓶颈不得不停下来,或者国内选手找到新的技术路径,才有可能打平。 


虽然百度的“文心一言”仍有很多发展的空间,但相信随着人才、技术、资金的投入,我国的AI会发展得越来越好。



参考链接:

[1]https://openai.com/product/gpt-4

[2]https://openai.com/research/gpt-4

[3]https://www.microsoft.com/en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/


来源:OpenAI官网、澎湃新闻,图片源于OpenAI官网,如侵删

监制:李璨
辑:张佳玲(实习)
审核:刘煜
责任编辑田江含











外国人来华政策,明起调整
享受挪威的免学费留学
硅谷银行破产事件愈演愈烈,将带来哪些影响?
3月13日:十四届全国人大一次会议闭幕
英国暑校申请进行时,让你的夏天与众不同
一起来听今年两会上代表委员有关教育、科技、人才的好声音
【《留学》“三缺一”】致力于实现每一个学生的名校梦
【独家】为全球学生解决教育费用问题 ——专访MPOWER Financing CEO Emmanuel Smadja
从新西兰到上海 对优质教育的探索永无止境——专访哈罗上海校长Alex Reed
《留学》杂志总第209期 |寒假将至, 如何合理安排假期?


扫描二维码

关注

【留学事务所】

微信公众平台

点击下方图片,了解留学杂志↓↓↓


联系我们

读者热线:400-803-1977

商务合作微信:13716319877


关注留学行业最新消息

客观深入报道行业事件

提供有价值的优质服务

想你所想 为你而来


入驻光明网、网易、腾讯、今日头条、一点资讯等各大平台



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
追赶ChatGPT,我们的差距在哪里?阿拉斯加邮轮行程最精彩的地方早鸟报|抖音回应上线全国外卖服务;百度类ChatGPT项目定名“文心一言”;美团一季度拟招1万人...“文心一言”正式发布,百度真的Ready了?“文心一言”后又见“商量”、“天工”、“智脑”,好多国产类ChatGPT产品即将面世中国版本的chatGPT——百度“文心一言”出来了!刚刚,百度发布文心一言!对比GPT-4实测!百度顶住压力,背水一战韦神出的这道题火了,GPT百度打假“文心一言”APP,已起诉苹果;新冠病毒可能来自人类;“华为AI大模型将上线”疑为资本炒作;全国最低工资标准出炉丨邦早报BB鸭 | ​德芙巧克力被曝缺斤少两;百度AI产品“文心一言”​即将上线;三星开始在印度组装手机新冠腹泻“文心一言”未至先火,大语言模型加持将开启百度发展新纪元Gpt 4一出,谁与争锋爱奇艺将全面接入百度“文心一言”|首席资讯日报美媒关注百度“文心一言”:临近发布,研发团队正加紧完善产品百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此ChatGPT全球赛开场,李彦宏已无退路,百度文心一言今日正式开始邀请测试!8点1氪:​抖音否认3月1日全国上线外卖服务;百度类ChatGPT项目定名“文心一言”;任天堂将全体员工基本工资统一上调10%二年级选课,忽闻一夜 GPT 来,千课 万课 AI 开亚马逊要求5月重返办公室 3万员工签名反对 ChatGPT“视频升级版”下周公布 将与百度“文心一言”对决百度财报解读:营收持平净利增,“文心一言”站C位实测文心一言,与GPT-4差距在哪?百度发布的是“文心一言”还是“温馨遗言”?百度“文心一言”,就这?AI新闻来了!中国基金报宣布接入百度“文心一言”,打造融媒体人工智能全系产品拥抱AI时代,澎湃新闻接入百度“文心一言”​少林寺宣布接入百度版 ChatGPT “文心一言”;​中消协点名智能电视套娃式收费;《羊了个羊》营收破亿……GPT迪士尼任命新任首席人力资源官;元隆雅图接入百度“文心一言”(广告狂人日报)信心不减!李彦宏称外界对百度“文心一言”的反馈跟他预期差不多百度将于3月16日召开“文心一言”发布会一首桃花观潮周报 |百度发布“文心一言”;315曝光医美、直播等行业乱象《中国企业家》杂志宣布接入百度“文心一言”每日经济新闻宣布接入百度“文心一言” 树立财经智媒新标杆生命的形观与气观:中西两个角度产生两个医学体系百度正式推出大语言模型“文心一言”“文心一言”上线前,我们去看了看它的心脏抖音将上线外卖服务,百度将上线聊天机器人“文心一言”,世纪华通回应将代理暴雪,韵达回应大量包裹派送异常,这就是今天的其它大新闻!微档案---姚念媛入境美国档案
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。