Redian新闻
>
GPT-4携手微软炸场,百度“文心一言”面世,差距在哪里?

GPT-4携手微软炸场,百度“文心一言”面世,差距在哪里?

公众号新闻



你是否想过,给AI发一张搞笑的照片,它能get到笑点,并且与你幽默地交流。你甚至可以把它作为一个虚拟对象进行交流倾诉。


你是否想过,给AI发一张食材的照片,它能够正确识别图片里的东西并且推断这些原料能够制作的菜,甚至为你提供相关菜谱。


甚至有一天,它能解放打工人的双手,帮助打工人生成文档、电子邮件和幻灯片。


这些,AI现在都能做到。


当地时间2023年3月14日, OpenAI宣布大型语言模型的最新版本GPT-4问世。GPT-4是一个大型多模态模型,可以接受图像和文本输入并产生文本输出,相较于GPT-3.5,它能够识别和分析图像。


OpenAI表示,他们创建了GPT-4,这是OpenAI在努力扩展深度学习方面的最新里程碑。


01

GPT-4强大在哪里?


GPT-4经过迭代更新后,拓展学习了广泛的知识,具备了更好的问题解决能力,能够更精确地处理复杂问题。


#GPT-4更可靠、更具创造性

GPT-4比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑、迭代创造性的、技术性的写作任务,例如创作歌曲、编写剧本或是学习用户的写作风格。


用一个句子描绘灰姑娘故事的情节,并且使用的单词开头必须按照A-Z的顺序,并且不重复任何字母。GPT-4表现出了超高的创造性。



#GPT-4的视觉输入

GPT-4可以接受文本和图像的提示符,并能与纯文本设置并行,允许用户指定任何视觉或语言任务。


GPT-4会接受图像作为输入,识别图像并生成说明、分类、分析。


比如这个图片

GPT-4不仅能够识别鸡蛋、面粉等原料,还能根据图片内容推荐制作相应的食物。


它甚至能看懂梗图

问GPT-4:这张图有什么好笑的?

GPT-4:用过时的大型VGA充现代智能手机iphone


能进行图表分析

GPT-4可以算格鲁吉亚和西亚人的人均每日肉类消费。


能做物理题


能理解照片中不对劲的地方


能看懂漫画




#GPT-4更可靠,在推理和语言能力方面比ChatGPT更先进

在比较简单的问题上,GPT-3.5与GPT-4的差别不是很大。但当任务足够复杂时,GPT-4会比GPT-3.5更可靠,能够处理更细微的指令。


让两个模型进行不同内容的考试和复杂的推问题,GPT-4这位“同学”能够在考试中表现得更好。


除此之外,GPT-4在除了英语的其他语言上的能力也十分强大。研究团队让GPT-4将涵盖了57个主题的14000个多项选择题翻译成多种语言,在测试的26种语言中,GPT-4在24种语言翻译中优于GPT-3.5。


#可操纵性

开发人员以及相关用户可以在“系统”消息中规定人工智能的风格和任务,而不是固定的冗长、平静经典的风格特征,系统消息允许用户在一定范围内自定义用户体验。


#处理更长的内容

GPT-4能够处理超过25000个单词的文本,能够进行长篇内容创作、更延展的对话以及查找分析资料。


02

各方态度


#微软

当地时间3月16日,微软举办了一场AI发布会,宣布推出名为Microsoft 365 Copilot的人工智能服务,将嵌入Word、PowerPoint、Excel等Office办公软件中,帮助用户生成文档、电子邮件以及幻灯片等。


微软董事长兼首席执行官萨蒂亚·纳德拉(Satya Nadella)称,“这是我们在计算交互方面迈出的重要一步,这将从根本上改变我们的工作方式,并开启新的生产力增长浪潮。”


除此之外,在正式发布前,GPT-4就已经为微软公司的新必应(New Bing)提供支持。



#谷歌

就在GPT-4发布的前几个小时,谷歌发布博文,宣布推出AIGC功能应用到办公软件中。但不同于OpenAI发布即可用,谷歌先提供给值得信赖的开发人员,其他功能则在晚些时候向公众开放。



#百度

在GPT-4发布的一天之后,百度全新一代知识增强大语言模型“文心一言”正式发布。该模型具备文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成五种能力。它与GPT-4有着类似的监督精调、RLHF和提示构建技术,在知识、检索和对话增强技术方面则突出百度特色。


此外,苹果、Meta和亚马逊等公司也在计划重新评估人工智能的开发策略。



03

相关应用


#为视觉障碍人士提供技术帮助

丹麦初创公司Be My Eyes从2012年开始就一直在为超过2.5亿盲人或低视力人群提供技术支持。


现如今有GPT-4的支持,它可以像志愿者一样需要视觉辅助人士,与他们聊天,分析并回答用户提供的图像和提出的问题,提供即时的视觉帮助。例如,GPT-4可以帮助需要视觉辅助的人访问比较混乱的购物和商务网站,帮助他们进行阅读搜索,提供比较正确的购买决定。


Be My Eyes首席执行官Michael Buckley表示:“在我们访问的短时间内,我们看到了任何图像到文本的对象识别工具都具有无与伦比的性能。这对全球无障碍环境的影响是深远的。在不远的将来,盲人和低视力群体将利用这些工具不仅满足大量视觉解读需求,而且在生活中拥有更大程度的独立性。”


#为语言学习人士提供练习帮助

GPT-4能为语言学习人士提供练习和纠错的帮助。3月14日,语言学习软件多邻国宣布,他们将利用OpenAI的GPT-4,在一个名为DuolingoMax的新订阅中推出两个新功能,扮演人工智能对话伙伴和“解释我的答案”。


角色扮演功能可以让用户身临其境地进行交流对话。得益于GPT-4,多领过能够指导用户完成不同场景的对话。例如点餐、第一次见面或购买机票等经典场景。


人工智能一直是我们战略的重要组成部分,”首席产品经理Edwin Bodge说道。“我们一直在使用它来个性化课程和进行Duolingo英语测试。但在学习者的旅程中,我们想填补一些空白:对话练习和对错误的上下文反馈。”


“解释我的答案”功能则能让用户能深层次了解分析自己的答案。有了GPT-4对错误内容的反馈的支持,用户可以了解正确答案或是明确错误产生的原因。


多邻国团队看到了GPT-4提供比以往任何时候都更有效、更具吸引力的学习体验的潜力,这将在一定程度上改善学习者的学习成果。


#更好的总结审查服务

Stripe是一个流行的支付网关平台,帮助企业和个人处理国际支付事务。该公司已经开始使用GPT-4。

Stripe表示,GPT-4可以更好地了解用户业务,并比人工审查人员更好地扫描网站以获得工作摘要。该公司的开发人员说,更新后的模型可以很容易地理解用户的问题,突出重要的部分,总结解决方案,甚至阅读十分详细的文档。

该公司还使用GPT-4分析社交媒体Discord上帖子的语法,以标记可疑账户,扫描入站通信并识别协同攻击。


除此之外,GPT-4具备能组织庞大的知识库,为学生定制个性化的课程,保护某个地区、国家的语言、文化和历史等功能。


04

局限性


尽管经过迭代更新,GPT-4的功能已经非常强大,但它仍然存在与早期GPT模型类似的风险,即仍然不完全可靠。它存在社会偏见,产生幻觉(模型编造了不存在的或错误的事实),生成错误答案,出现推理错误等。


GPT-4在输出中可能存在各种偏差。OpenAI的目标是让人工系统具有合理的默认行为,反映广泛的用户价值观,允许系统进行私人定制和确定界限,但GPT-4暂时还不能达到这样的水平。


其次,GPT-4缺乏对绝大多数数据中断后发生的事件的了解,并且不能吸取经验教训。有时它会犯一些简单的推理错误,或是在过于轻信用户明显的虚假陈述。除此之外,它可能难以处理棘手的问题,例如在它生成的安全代码中引入安全漏洞。


除此之外,GPT-4在预测方面也会出现差错,出错在于没有仔细检查工作。


05

存在的风险


GPT-4仍然存在与以前模型类似的风险,例如生成有害的建议、产生错误的代码或是不准确的信息。


OpenAI与50多位专家合作,根据更多用户的反馈,进一步对GPT-4的行为、安全性和监测系统进行改善。总的来说,通过干预,GPT-4增加了引发不良行为和反馈的难度。但仍然存在一些“越狱”的行为,违反了使用指南的内容。随着人工智能系统升级和风险的增加,这些干预措施和实现极高可靠性变得至关重要。


GPT-4和后续模型有可能以有益和有害的方式对社会产生重大影响。OpenAI正在与外部研究人员合作,以改进对潜在影响的理解和评估方式,并对未来系统中可能出现的危险能力进行评估。

06 国内相关产品的差距在哪里?


自2022年12月ChatGPT发布之后,无论是一级市场,还是国内外的大厂,都在发力大模型,研发类ChatGPT产品。百度也跟紧步伐,于2023年3月16日推出“文心一言”产品。


但事实上,国内的相关产品与GPT-4之间有着比较大的差距。“文心一言”在问答问题的准确性、灵活性、多样性上仍有提升空间,相较于GPT-4还稍显生硬和模式化。


而差距拉大的背后,是人才、资金投入和技术积累的差距。过去十几年里百度一直在AI方面投入,包括2019年推出文心大语言模型。2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。 


但是,百度和OpenAI还有不小差距。李彦宏也表示,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。因为深度学习、自然语言处理,需要多年的坚持和积累,没法速成。 


王晟曾指出,中国的ChatGPT们即便奋起直追,静态来讲两三年能追上就已经是乐观情况。但如果对方一直进化,且进展速度远比追得速度要快,那么可能永远都追不上。直到对方遇到瓶颈不得不停下来,或者国内选手找到新的技术路径,才有可能打平。 


虽然百度的“文心一言”仍有很多发展的空间,但相信随着人才、技术、资金的投入,我国的AI会发展得越来越好。



参考链接:

[1]https://openai.com/product/gpt-4

[2]https://openai.com/research/gpt-4

[3]https://www.microsoft.com/en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/


来源:OpenAI官网、澎湃新闻,图片源于OpenAI官网,如侵删

监制:李璨
辑:张佳玲(实习)
审核:刘煜
责任编辑田江含











外国人来华政策,明起调整
享受挪威的免学费留学
硅谷银行破产事件愈演愈烈,将带来哪些影响?
3月13日:十四届全国人大一次会议闭幕
英国暑校申请进行时,让你的夏天与众不同
一起来听今年两会上代表委员有关教育、科技、人才的好声音
【《留学》“三缺一”】致力于实现每一个学生的名校梦
【独家】为全球学生解决教育费用问题 ——专访MPOWER Financing CEO Emmanuel Smadja
从新西兰到上海 对优质教育的探索永无止境——专访哈罗上海校长Alex Reed
《留学》杂志总第209期 |寒假将至, 如何合理安排假期?


扫描二维码

关注

【留学事务所】

微信公众平台

点击下方图片,了解留学杂志↓↓↓


联系我们

读者热线:400-803-1977

商务合作微信:13716319877


关注留学行业最新消息

客观深入报道行业事件

提供有价值的优质服务

想你所想 为你而来


入驻光明网、网易、腾讯、今日头条、一点资讯等各大平台



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
“文心一言”后又见“商量”、“天工”、“智脑”,好多国产类ChatGPT产品即将面世爱奇艺将全面接入百度“文心一言”|首席资讯日报拥抱AI时代,澎湃新闻接入百度“文心一言”“文心一言”正式发布,百度真的Ready了?百度财报解读:营收持平净利增,“文心一言”站C位信心不减!李彦宏称外界对百度“文心一言”的反馈跟他预期差不多追赶ChatGPT,我们的差距在哪里?新冠腹泻抖音将上线外卖服务,百度将上线聊天机器人“文心一言”,世纪华通回应将代理暴雪,韵达回应大量包裹派送异常,这就是今天的其它大新闻!观潮周报 |百度发布“文心一言”;315曝光医美、直播等行业乱象Gpt 4一出,谁与争锋迪士尼任命新任首席人力资源官;元隆雅图接入百度“文心一言”(广告狂人日报)ChatGPT全球赛开场,李彦宏已无退路,百度文心一言今日正式开始邀请测试!百度正式推出大语言模型“文心一言”美媒关注百度“文心一言”:临近发布,研发团队正加紧完善产品阿拉斯加邮轮行程最精彩的地方二年级选课,忽闻一夜 GPT 来,千课 万课 AI 开“文心一言”未至先火,大语言模型加持将开启百度发展新纪元AI新闻来了!中国基金报宣布接入百度“文心一言”,打造融媒体人工智能全系产品早鸟报|抖音回应上线全国外卖服务;百度类ChatGPT项目定名“文心一言”;美团一季度拟招1万人...GPT微档案---姚念媛入境美国档案生命的形观与气观:中西两个角度产生两个医学体系百度打假“文心一言”APP,已起诉苹果;新冠病毒可能来自人类;“华为AI大模型将上线”疑为资本炒作;全国最低工资标准出炉丨邦早报​少林寺宣布接入百度版 ChatGPT “文心一言”;​中消协点名智能电视套娃式收费;《羊了个羊》营收破亿……韦神出的这道题火了,GPT实测文心一言,与GPT-4差距在哪?百度“文心一言”,就这?“文心一言”上线前,我们去看了看它的心脏8点1氪:​抖音否认3月1日全国上线外卖服务;百度类ChatGPT项目定名“文心一言”;任天堂将全体员工基本工资统一上调10%一首桃花BB鸭 | ​德芙巧克力被曝缺斤少两;百度AI产品“文心一言”​即将上线;三星开始在印度组装手机中国版本的chatGPT——百度“文心一言”出来了!百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此刚刚,百度发布文心一言!对比GPT-4实测!百度顶住压力,背水一战每日经济新闻宣布接入百度“文心一言” 树立财经智媒新标杆《中国企业家》杂志宣布接入百度“文心一言”百度发布的是“文心一言”还是“温馨遗言”?亚马逊要求5月重返办公室 3万员工签名反对 ChatGPT“视频升级版”下周公布 将与百度“文心一言”对决百度将于3月16日召开“文心一言”发布会
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。