GPT-4携手微软炸场,百度“文心一言”面世,差距在哪里?
你是否想过,给AI发一张搞笑的照片,它能get到笑点,并且与你幽默地交流。你甚至可以把它作为一个虚拟对象进行交流倾诉。
你是否想过,给AI发一张食材的照片,它能够正确识别图片里的东西并且推断这些原料能够制作的菜,甚至为你提供相关菜谱。
甚至有一天,它能解放打工人的双手,帮助打工人生成文档、电子邮件和幻灯片。
这些,AI现在都能做到。
当地时间2023年3月14日, OpenAI宣布大型语言模型的最新版本GPT-4问世。GPT-4是一个大型多模态模型,可以接受图像和文本输入并产生文本输出,相较于GPT-3.5,它能够识别和分析图像。
OpenAI表示,他们创建了GPT-4,这是OpenAI在努力扩展深度学习方面的最新里程碑。
01
GPT-4强大在哪里?
GPT-4经过迭代更新后,拓展学习了广泛的知识,具备了更好的问题解决能力,能够更精确地处理复杂问题。
#GPT-4更可靠、更具创造性
GPT-4比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑、迭代创造性的、技术性的写作任务,例如创作歌曲、编写剧本或是学习用户的写作风格。
用一个句子描绘灰姑娘故事的情节,并且使用的单词开头必须按照A-Z的顺序,并且不重复任何字母。GPT-4表现出了超高的创造性。
#GPT-4的视觉输入
GPT-4可以接受文本和图像的提示符,并能与纯文本设置并行,允许用户指定任何视觉或语言任务。
GPT-4会接受图像作为输入,识别图像并生成说明、分类、分析。
比如这个图片
GPT-4不仅能够识别鸡蛋、面粉等原料,还能根据图片内容推荐制作相应的食物。
它甚至能看懂梗图
问GPT-4:这张图有什么好笑的?
GPT-4:用过时的大型VGA充现代智能手机iphone
能进行图表分析
GPT-4可以算格鲁吉亚和西亚人的人均每日肉类消费。
能做物理题
能理解照片中不对劲的地方
能看懂漫画
#GPT-4更可靠,在推理和语言能力方面比ChatGPT更先进
在比较简单的问题上,GPT-3.5与GPT-4的差别不是很大。但当任务足够复杂时,GPT-4会比GPT-3.5更可靠,能够处理更细微的指令。
让两个模型进行不同内容的考试和复杂的推问题,GPT-4这位“同学”能够在考试中表现得更好。
除此之外,GPT-4在除了英语的其他语言上的能力也十分强大。研究团队让GPT-4将涵盖了57个主题的14000个多项选择题翻译成多种语言,在测试的26种语言中,GPT-4在24种语言翻译中优于GPT-3.5。
#可操纵性
开发人员以及相关用户可以在“系统”消息中规定人工智能的风格和任务,而不是固定的冗长、平静经典的风格特征,系统消息允许用户在一定范围内自定义用户体验。
#处理更长的内容
GPT-4能够处理超过25000个单词的文本,能够进行长篇内容创作、更延展的对话以及查找分析资料。
02
各方态度
#微软
当地时间3月16日,微软举办了一场AI发布会,宣布推出名为Microsoft 365 Copilot的人工智能服务,将嵌入Word、PowerPoint、Excel等Office办公软件中,帮助用户生成文档、电子邮件以及幻灯片等。
微软董事长兼首席执行官萨蒂亚·纳德拉(Satya Nadella)称,“这是我们在计算交互方面迈出的重要一步,这将从根本上改变我们的工作方式,并开启新的生产力增长浪潮。”
除此之外,在正式发布前,GPT-4就已经为微软公司的新必应(New Bing)提供支持。
#谷歌
就在GPT-4发布的前几个小时,谷歌发布博文,宣布推出AIGC功能应用到办公软件中。但不同于OpenAI发布即可用,谷歌先提供给值得信赖的开发人员,其他功能则在晚些时候向公众开放。
#百度
在GPT-4发布的一天之后,百度全新一代知识增强大语言模型“文心一言”正式发布。该模型具备文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成五种能力。它与GPT-4有着类似的监督精调、RLHF和提示构建技术,在知识、检索和对话增强技术方面则突出百度特色。
此外,苹果、Meta和亚马逊等公司也在计划重新评估人工智能的开发策略。
03
相关应用
#为视觉障碍人士提供技术帮助
丹麦初创公司Be My Eyes从2012年开始就一直在为超过2.5亿盲人或低视力人群提供技术支持。
现如今有GPT-4的支持,它可以像志愿者一样需要视觉辅助人士,与他们聊天,分析并回答用户提供的图像和提出的问题,提供即时的视觉帮助。例如,GPT-4可以帮助需要视觉辅助的人访问比较混乱的购物和商务网站,帮助他们进行阅读搜索,提供比较正确的购买决定。
Be My Eyes首席执行官Michael Buckley表示:“在我们访问的短时间内,我们看到了任何图像到文本的对象识别工具都具有无与伦比的性能。这对全球无障碍环境的影响是深远的。在不远的将来,盲人和低视力群体将利用这些工具不仅满足大量视觉解读需求,而且在生活中拥有更大程度的独立性。”
#为语言学习人士提供练习帮助
GPT-4能为语言学习人士提供练习和纠错的帮助。3月14日,语言学习软件多邻国宣布,他们将利用OpenAI的GPT-4,在一个名为DuolingoMax的新订阅中推出两个新功能,扮演人工智能对话伙伴和“解释我的答案”。
角色扮演功能可以让用户身临其境地进行交流对话。得益于GPT-4,多领过能够指导用户完成不同场景的对话。例如点餐、第一次见面或购买机票等经典场景。
人工智能一直是我们战略的重要组成部分,”首席产品经理Edwin Bodge说道。“我们一直在使用它来个性化课程和进行Duolingo英语测试。但在学习者的旅程中,我们想填补一些空白:对话练习和对错误的上下文反馈。”
“解释我的答案”功能则能让用户能深层次了解分析自己的答案。有了GPT-4对错误内容的反馈的支持,用户可以了解正确答案或是明确错误产生的原因。
多邻国团队看到了GPT-4提供比以往任何时候都更有效、更具吸引力的学习体验的潜力,这将在一定程度上改善学习者的学习成果。
#更好的总结审查服务
Stripe是一个流行的支付网关平台,帮助企业和个人处理国际支付事务。该公司已经开始使用GPT-4。
Stripe表示,GPT-4可以更好地了解用户业务,并比人工审查人员更好地扫描网站以获得工作摘要。该公司的开发人员说,更新后的模型可以很容易地理解用户的问题,突出重要的部分,总结解决方案,甚至阅读十分详细的文档。
该公司还使用GPT-4分析社交媒体Discord上帖子的语法,以标记可疑账户,扫描入站通信并识别协同攻击。
除此之外,GPT-4具备能组织庞大的知识库,为学生定制个性化的课程,保护某个地区、国家的语言、文化和历史等功能。
04
局限性
尽管经过迭代更新,GPT-4的功能已经非常强大,但它仍然存在与早期GPT模型类似的风险,即仍然不完全可靠。它存在社会偏见,产生幻觉(模型编造了不存在的或错误的事实),生成错误答案,出现推理错误等。
GPT-4在输出中可能存在各种偏差。OpenAI的目标是让人工系统具有合理的默认行为,反映广泛的用户价值观,允许系统进行私人定制和确定界限,但GPT-4暂时还不能达到这样的水平。
其次,GPT-4缺乏对绝大多数数据中断后发生的事件的了解,并且不能吸取经验教训。有时它会犯一些简单的推理错误,或是在过于轻信用户明显的虚假陈述。除此之外,它可能难以处理棘手的问题,例如在它生成的安全代码中引入安全漏洞。
除此之外,GPT-4在预测方面也会出现差错,出错在于没有仔细检查工作。
05
存在的风险
GPT-4仍然存在与以前模型类似的风险,例如生成有害的建议、产生错误的代码或是不准确的信息。
OpenAI与50多位专家合作,根据更多用户的反馈,进一步对GPT-4的行为、安全性和监测系统进行改善。总的来说,通过干预,GPT-4增加了引发不良行为和反馈的难度。但仍然存在一些“越狱”的行为,违反了使用指南的内容。随着人工智能系统升级和风险的增加,这些干预措施和实现极高可靠性变得至关重要。
GPT-4和后续模型有可能以有益和有害的方式对社会产生重大影响。OpenAI正在与外部研究人员合作,以改进对潜在影响的理解和评估方式,并对未来系统中可能出现的危险能力进行评估。
06 国内相关产品的差距在哪里?
自2022年12月ChatGPT发布之后,无论是一级市场,还是国内外的大厂,都在发力大模型,研发类ChatGPT产品。百度也跟紧步伐,于2023年3月16日推出“文心一言”产品。
但事实上,国内的相关产品与GPT-4之间有着比较大的差距。“文心一言”在问答问题的准确性、灵活性、多样性上仍有提升空间,相较于GPT-4还稍显生硬和模式化。
而差距拉大的背后,是人才、资金投入和技术积累的差距。过去十几年里百度一直在AI方面投入,包括2019年推出文心大语言模型。2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。
但是,百度和OpenAI还有不小差距。李彦宏也表示,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。因为深度学习、自然语言处理,需要多年的坚持和积累,没法速成。
王晟曾指出,中国的ChatGPT们即便奋起直追,静态来讲两三年能追上就已经是乐观情况。但如果对方一直进化,且进展速度远比追得速度要快,那么可能永远都追不上。直到对方遇到瓶颈不得不停下来,或者国内选手找到新的技术路径,才有可能打平。
虽然百度的“文心一言”仍有很多发展的空间,但相信随着人才、技术、资金的投入,我国的AI会发展得越来越好。
参考链接:
[1]https://openai.com/product/gpt-4
[2]https://openai.com/research/gpt-4
[3]https://www.microsoft.com/en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/
扫描二维码
关注
【留学事务所】
微信公众平台
点击下方图片,了解留学杂志↓↓↓
联系我们
读者热线:400-803-1977
商务合作微信:13716319877
关注留学行业最新消息
客观深入报道行业事件
提供有价值的优质服务
想你所想 为你而来
入驻光明网、网易、腾讯、今日头条、一点资讯等各大平台
微信扫码关注该文公众号作者