Redian新闻
>
大型语言模型(LLM)的潜力有多大?

大型语言模型(LLM)的潜力有多大?

财经

* 后台回复“商论入群”即刻主编领读(订户专属全年服务)

通过处理最人性化的媒介——对话,ChatGPT现在让使用互联网的公众体验到了类似的“智力眩晕”。伴随这种兴奋而来的是科技行业内外的深切担忧:生成式AI模型的开发速度过快了。GPT-4就是一种称为大型语言模型(LLM)的生成式AI。Alphabet、亚马逊和英伟达等科技巨头都训练了自己的LLM,把LLM的力量放到很多人手中意味着许多头脑可以构想出创新的新应用,改进从医学到法律的一切,但也意味着让科技精英夜不能寐的灾难性风险变得更大。《经济学人·商论》本周连续推出AI专题系列文章,欢迎订阅阅读中英双语原文。


《经济学人·商论》2023-05-16
Large, creative AI models will transform lives and labour markets

生成式AI
大型创造性人工智能模型将改变生活和劳动力市场
它们带来了巨大的希望和危险。但它们是如何工作的?【深度】

自创造ChatGPT的公司OpenAI在2022年11月首次向公众开放聊天机器人以来,技术精英们几乎没有其他想聊的话了。GPT-4是ChatGPT背后的人工神经网络,在美国的法律和医学执照考试中取得了优异的成绩。伴随这种兴奋而来的是科技行业内外的深切担忧:生成式AI模型的开发速度过快了。GPT-4是一种称为大型语言模型(LLM)的生成式AI。Alphabet、亚马逊和英伟达等科技巨头都训练了自己的LLM,把它们命名为PaLM、Megatron、Titan和Chinchilla等。


那位伦敦科技公司的老板表示,即使他也在追求运用AI,他也“对AI带来的生存威胁感到难以置信的紧张”,并且“每天都在与[其他]创始人谈论它”。美国、欧洲和中国的政府都开始考虑制定新的法规。一些知名人士呼吁暂停AI的发展,以免软件以某种方式失控并损害甚至摧毁人类社会。若你想把对这项技术的担忧或兴奋调整到恰当的程度,不妨首先了解它是怎么来的、它的工作原理,以及它发展的局限性。


虽然可以写下它们如何工作的规则,但LLM的输出并不完全可预测;事实证明,这些极大的算盘可以做较小的算盘做不到的事情,甚至让制造它们的人大吃一惊。OpenAI的研究员已经在各种不同的LLM中统计到了137种所谓的“涌现”能力。涌现的能力并非魔法——它们都以某种形式体现在LLM的训练数据中,但直到LLM的规模超过某个非常大的阈值时才会变得明显。在某个规模下,LLM用德语写出性别包容的句子的水平和随机写的差不多。然而,把模型稍微再扩大一点,突然间它就显现了一种新的能力。... ...


【付费深度文章】欢迎打开商论App,订阅后获取更多《经济学人》核心观点:

  • LLM实际上是一项庞大的统计学操作——它是如何工作的?
  • LLM只会以统计而非语法的方式来理解。它更像是一个算盘,而不是一个头脑
  • LLM的输出并不完全可预测;OpenAI研究员已经在各种不同的LLM中统计到了137种所谓的“涌现”能力
  • 涌现的能力令人兴奋,因为它们暗示了LLM尚未开发的潜力——但也可能意味着风险
  • 很难判断哪些有害行为可能处于休眠状态,等待着规模扩大一点时被释放出来
  • LLM的注意力网络是从如此海量的数据中学习的关键



衍生阅读 | GPT企业级应用的挑战


谷歌云计算部门首席技术专家威尔·格兰尼斯(Will Grannis)指出,在采用新技术上,企业的要求要比消费者要高得多。保护机密或敏感数据就是担忧之一,这已导致从摩根大通到国防承包商诺斯罗普格鲁曼禁止员工在工作中使用ChatGPT。一个更大的问题是可靠性。ChatGPT这类工具能给出貌似可信但违背事实的信息——这个过程被委婉地形容为“错觉”。一些人担心出现大量由AI生成的诈骗、错误信息和计算机病毒。但最大的问题还是人与AI的关系。


《经济学人·商论》2023-05-05
How businesses are experimenting with ChatGPT-like services

熊彼特
企业试水ChatGPT类服务
假以时日,这可能将带来收获

每个财报季都会产生新的流行语。在各大公司准备最新一季财报时,许多老板肯定会把一个词挂在嘴边——生成式AI。自打AI聊天机器人ChatGPT惊艳面世,老板们就一直垂涎生成式AI提高生产率的潜力。苏黎世保险集团(Zurich)正在使用定制版ChatGPT来简化冗长的索赔文件。玩具制造商美泰(Mattel)运用DALL-E设计新玩具,DALL-E是另一个根据文本提示生成图像的AI工具。生物技术公司Absci利用这项神奇新技术来辅助开发治疗性抗体。许多其他公司也都开始试水这一陌生领域。

知识经济的工具制造商更是全情拥抱了这股创新热潮。微软宣布了连串产品升级计划,将可以减轻办公室员工的工作负担,从起草电子邮件、汇总文件内容到写代码等等。微软云计算部门的AI主管埃里克·博伊德(Eric Boyd)在形容公司繁忙的发布安排时说,“一天当一周用。”竞争对手谷歌同样在改装升级自家的工具套件。分别为创意设计人员、销售人员和金融精英提供软件的Adobe、Salesforce和彭博也是如此。类似ChatGPT的法律AI助理Harvey和写作AI助手Jasper等创业公司正快速而密集地崛起。

尽管各种试验如火如荼,企业仍不确定该如何利用AI的新能力。博伊德表示,大多数公司不是低估就是高估了该技术的能力。人们正在研究哪些工作最适合通过AI重塑。ChatGPT和DALL-E背后的公司OpenAI在3月发表了一项研究,盘点了在各种职业里,使用生成式AI可把工作效率提高至少一半的任务占多大比例。排在前面的是涉及大量程式化写作、数字处理或计算机编程的职业,例如律师助理、金融分析师和网页设计师。... ...

【付费文章】欢迎打开商论App,订阅后搜索“熊彼特”获取更多《经济学人》核心观点

《经济学人·商论》持续关注全球大趋势,欢迎订阅浏览。订阅商论,即可免费加入【主编领读社群】获取完整解读

* 后台回复“商论入群”即刻主编领读(订户专属全年服务)





🎉订户专享福利



主编领读 · 订户专属社群 

    每日主编精选文章推送 & 主编解读
    与商论主编沟通交流

* 后台回复“商论入群”即刻体验主编领读!

 全年商论英语学习社区 

    ✓译者领读
    ✓每日一词+学人习语+译者课堂持续更新

 海量商论中英双语往期内容 

    超过3000篇双语文章+译文 

    超过一万分钟主播朗读原文

    ✓双语纪录片 


*入群方式:完成订阅 - 关注微信服务号【经济学人全球商业评论】并后台回复关键词“订户入群” - 添加小助理企业微信等待审核后被邀请加入商论订户专属群


订阅商论即赠全年学习社区+主编领读社群

点击“阅读原文”,优惠订阅全年商论 ↓

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
基于重排序的新量化方法RPTQ:实现大型语言模型的 3 比特量化大语言模型(LLM)分布式训练框架总结AI女友年赚4个亿,AI的潜力有多巨大?邀请您参加IEEE网络技术论坛:基于大型语言模型的组合推理有证据了,MIT表明:大型语言模型≠随机鹦鹉,确实能学到语义大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4Tools解密大型语言模型:从相关性中发现因果关系?InfoQ 2023 年趋势报告:影响组织文化的两个最大的因素是大裁员和 ChatGPT 等大型语言模型双面间谍马英九【保姆级】深入解析大型语言模型核心技术如何更好地蒸馏ChatGPT模型能力:Lion闭源大型语言模型的对抗性蒸馏模型原理及实验工作介绍面向真实用户需求的中文大语言模型评测第二期(LLMEVAL-2)发布《The Red Hat》的写作:一次意想不到的重要训练大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写中文医学大模型“本草”(原名华驼):医学知识增强在中文大型语言模型指令微调上的初步探索大型语言模型综述全新出炉!从T5到GPT-4最全盘点,国内20余位研究者联合撰写大型语言模型也能跑在浏览器上了!又一ChatGPT平替诞生,训练成本8.5万美元大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机北京内推 | 阿里达摩院招聘大型语言模型(LLM)应用方向实习生对唐诗三百首中,那些难以索解的诗句,我的理解,之二:【李商隐,锦瑟】表现优于 GPT-4,ChemCrow 集成 13 种化学工具,增强大型语言模型的化学性能银行业专用大型语言模型落地大型语言模型与知识图谱协同研究综述:两大技术优势互补Stability AI宣布推出新的开源大型语言模型大型语言模型的推理演算ACL 2023长文 | 先计划再求解:提升大型语言模型的零样本链式推理Pienso为企业提供由云上IPU支持的高效大型语言模型访问长篇小说《如絮》第一百零六章 旧金山-2004年 看起来完美褪黑素能预防睡眠不足导致的记忆缺陷;大型语言模型综述全新出炉:从T5到GPT-4最全盘点|本周论文推荐关于大型语言模型的争论和局限讲座预告 | 软件工程学院博学论坛第十五期:自然语言处理与大型语言模型的挑战与探索最新综述!当大型语言模型(LLM)遇上知识图谱:两大技术优势互补百篇论文纵览大型语言模型最新研究进展双林奇案录第三部之天禅寺:第九节以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。