Redian新闻
>
谷歌推出PaLM 2反击GPT-4!

谷歌推出PaLM 2反击GPT-4!

公众号新闻

出品 | OSC开源社区(ID:oschina2013)

谷歌在 2023 年度 I/O 大会上宣布推出了其下一代大型语言模型 PaLM 2,擅长高级推理任务,包括代码和数学、分类和问答、翻译和多语言能力以及自然语言生成。

谷歌声称 PaLM 2 是一种最先进的语言模型,要优于其之前所有的 LLM,包括 PaLM。目前,PaLM 2 已被用于 Med-PaLM 2 和 Sec-PaLM,并为谷歌的生成人工智能功能和工具(如 Bard 和 PaLM API)提供支持。

推理:PaLM 2 可以将复杂的任务分解为更简单的子任务,并且比以前的 LLM(如 PaLM)更善于理解人类语言的细微差别。例如,PaLM 2 擅长理解谜语和成语,这需要理解词语的歧义和比喻意义,而不是字面意义。

多语言翻译:PaLM 2 在一个包含 100 多种语言的语料库上进行了训练,使得 PaLM 2 擅长多语言任务,包括比以前的模型更细微的措辞。

编码:PaLM 2 还可以理解、生成和调试代码,并接受了 20 多种编程语言的预训练。这意味着它擅长使用 Python 和 JavaScript 等流行的编程语言,但也能够使用 Prolog、Fortran 和 Verilog 等语言生成专用代码。将此与其语言功能相结合可以帮助团队跨语言协作。

根据介绍,PaLM 2 因其构建方式而擅长高级推理、翻译和代码生成等任务。它通过统一大型语言模型中三个不同的研究进展,对其前身 PaLM 进行了改进:

  • 使用计算最优缩放:计算最优缩放的基本思想是按比例缩放模型大小和训练数据集大小。这种新技术使 PaLM 2 比 PaLM 更小,但效率更高,整体性能更好,包括更快的推理、更少的服务参数和更低的服务成本。

  • 改进的数据集混合:以前的 LLM,如 PaLM,使用的预训练数据集主要是英文文本。PaLM 2 通过更多语言和多样化的预训练混合改进了其语料库,其中包括数百种人类和编程语言、数学方程式、科学论文和网页。

  • 更新的模型架构和目标:PaLM 2 具有改进的架构,并接受了各种不同任务的训练,所有这些都有助于 PaLM 2 学习语言的不同方面。

谷歌方面指出,一些基准测试表明,PaLM 2 在推理性和多语言性方面的性能要明显优于 PaLM。且 PaLM 2 还改进了 PaLM 和谷歌翻译在葡萄牙语和中文等语言上的翻译能力。

此外,谷歌还在随附的一份 PaLM 2 技术报告论文中透露了,该公司为评估 PaLM 2 在任务上的表现而向 human annotators 支付的报酬 —— 每项判决 0.015 美元。

论文中还阐述了目前 PaLM 2 所存在的不足。在一项旨在了解 PaLM 2 生成有毒文本 (toxic text) 的频率的测试中,合著者使用了一个包含明确的有毒和隐含的或微妙的有害语言混合样本的数据集。当输入明确的有害提示时,PaLM 2 在 30% 以上的时间里产生了有害的反应,对隐含有害的提示的反应则更为甚之(60%)。

在尤其是英语、德语和葡萄牙语等某些语言中,PaLM 2 总体上倾向于更明显地产生有害反应。在一次偏差测试中,该模型几乎有五分之一 (17.9%) 的时间给出了有害的反应,提示提到种族身份 “黑人” 和 “白人” 以及宗教 “犹太教” 和 “伊斯兰教” 时程度更加明显。

“基于 PaLM 2 构建的提示对话系统继续产生有毒的语言伤害,并在这些伤害如何因语言和与身份术语相关的查询而异方面表现出偏见模式。重要的是,这些偏见在不同语言和身份术语之间并不一致,我们看到了偏见...... 尽管这些偏见在对话提示中明确针对。”

研究人员在测试中发现,在 PaLM 2 对提示做出错误回应的所有时间中,有 38.2% 的时间 “强化了有害的社会偏见”。在处理模棱两可的提示时,模型应该承认它不知道答案,但它只有 0.6% 的时间做出了正确回应;更糟糕的是,它更有可能以有偏见的方式做出回应。示例:

更多详情可查看完整报告https://ai.google/static/documents/palm2techreport.pdf


往期推荐



Safari险胜Edge,全球第二
前端框架Svelte放弃TypeScript,JS赢!

首个中文医学知识LLM:真正的赛华佗—华驼(HuaTuo)



🌟 活动推荐

2023 年 5 月 27-28 日,GOTC 2023 全球开源技术峰会将在上海张江科学会堂隆重举行。
为期 2 天的开源行业盛会,将以行业展览、主题发言、特别论坛、分论坛、快闪演讲的形式来诠释此次大会主题 ——“Open Source, Into the Future”。与会者将一起探讨元宇宙、3D 与游戏、eBPF、Web3.0、区块链等热门技术主题,以及 OSPO、汽车软件、AIGC、开源教育培训、云原生等热门话题,探讨开源未来,助力开源发展。
长按识别下方二维码立即查看 GOTC 2023 详情/报名。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
斯坦福最新LLM排行榜发布!自家Alpaca垫底,华人团队WizardLM开源第一,GPT-4、Claude稳居前二红杉、谷歌推荐!斯坦福疯传的转码课程:小白1个月学会拿下15万年薪Offer微软跟进谷歌反击,GPT-4引发新一轮AI风暴【𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶无痕内裤】49元三条!巨巨巨好穿 !!简直就是辣妹顶配,食品级冰箱收纳盒【一日团】重磅!清华ChatGLM2开源!中文榜居首,碾压GPT-4!举报、告密与反告密叫板ChatGPT?Stability AI 开源语言大模型 StableLM,参数仅为GPT-3百分之四,却能实现超高性能剑桥&腾讯AI Lab提出PandaGPT:一个模型统一六种模态宾州新希望小城(New Hope),秋景名片性能超越GPT-4!谷歌推出大语言模型PaLM 2,全面升级Bard反击ChatGPT|环球科学要闻渔歌子(2):三月蝉鸣初入林神奇LLM引擎上线!帮你把GPT-3直接调成ChatGPT谷歌正推出Passkey,密码将成历史谷歌的又一波反击!开放大语言模型PaLM API谷歌打响全面反击战!官宣AI重构搜索、新模型比肩GPT-4,朝着ChatGPT微软开炮英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLMBelmont公私校大对比:Belmont Hill vs Belmont High谷歌I/O开发者大会发布全新大语言模型,反超GPT-4!办公全家桶炸裂升级,还带来了首款折叠屏手机谷歌推出多模态Vid2Seq,理解视频IQ在线,字幕君不会下线了|CVPR 2023北大、西湖大学等开源「裁判大模型」PandaLM:三行代码全自动评估LLM,准确率达ChatGPT的94%碾压GPT-4!谷歌DeepMind CEO自曝:下一代大模型将与AlphaGo合体谷歌发大模型PaLM 2对抗GPT-4,生成式AI融入谷歌搜索,急切反击背后,搜索摇钱树要倒?对标GPT-4!谷歌发布大语言模型PaLM 2,可在手机运行,云、搜索、电邮等一网打尽!谷歌打响全面反击战!官宣 AI 重构搜索、新模型比肩 GPT-4,朝着 ChatGPT 微软开炮向ChatGPT开炮!谷歌打响全面反击战!官宣新模型比肩GPT-4!谷歌推出人工智能工具,发力靶标发现和数据分析,加速药物发现和精准医疗最新一季《锵锵行天下》 - 西湖真美。我发小就一直生活在西湖畔,羡慕死我了。说好退休后去她那儿歇一段日子谷歌不服输:大模型PaLM2剑指GPT-4,Bard会写20种代码,推出办公助手「Duet A​I」免费版GPT-4!美国AI初创公司推出Forefront Chat,火到官网崩溃LLM底座模型:LLaMA、Palm、GLM、BLOOM、GPT结构对比美工失业预告?Photoshop推出P图专用AI,效果惊人到可怕!神奇LLM引擎上线:帮你把GPT-3直接调成ChatGPTGPT-3.5逆袭GPT-4!谷歌DeepMind华人天团,让LLM像人类一样制作工具,完胜CoT免费版 GPT-4!美国 AI 初创公司推出 Forefront Chat,火到官网崩溃冒雨观看圣帕特里克节游行(多图)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。