能规划、会推理,生成式AI接下来会做什么?
* 商论周年庆·特惠订阅进行中!
”
以莎士比亚十四行诗的形式表述量子物理?一个海盗会怎么介绍贸易理论?讲一只恐龙遨游太空的童话故事……人们乐此不疲地让现代聊天机器人生成各种各样稀奇古怪的文字。有些请求在现实世界中是有用的,比如旅行路线、学校作文或计算机代码。现代大型语言模型(LLM)可以生成所有这些内容。不过,想用GPT写作业的人要当心:这些模型可能会弄错一些事实,还容易出现其创造者称之为“幻觉”的奇思异想。《经济学人·商论》连续一周推出AI专题系列文章,欢迎订阅阅读中英双语原文。
除了偶发的小问题,所有这一切都体现了巨大的进步。即便放在几年前,这样的程序还只存在于科幻小说中。但大量按需写作可能并不是LLM最重要的能力。它们的文本生成能力使它们能够充当多用途的推理引擎。它们可以遵循指令,制定计划,发出命令来让其他系统执行。
毕竟,语言不仅仅是文字,还是世界“底层复杂性的一种表现”,斯坦福大学下属以人为本人工智能研究所(Institute for Human-Centred Artificial Intelligence)教授珀西·梁(Percy Liang,音译)指出。这就意味着,一个有关语言如何运作的模型在某种意义上也包含了有关世界如何运作的模型。AI投资基金Air Street Capital的内森·贝纳奇(Nathan Benaich)说,一个接受大量文本训练的LLM“基本上是在补全文本的基础上学习推理”。
用LLM控制其他组件的系统正在激增。例如,由浙江大学和微软研究院创建的HuggingGPT把ChatGPT用作一个任务规划器,把用户的问询请求分配给从Hugging Face中调取的AI模型。Hugging Face是一个集合了为文本、图像和音频任务接受训练的各种模型的工具库。由微软研究人员创建的TaskMatrix.AI让聊天机器人与音乐服务、电商网站、网络游戏等线上资源展开交互。... ...
📚 衍生阅读 | LLM是如何工作的?
GPT-4是一种称为大型语言模型(LLM)的生成式AI。Alphabet、亚马逊和英伟达等科技巨头都训练了自己的LLM,把它们命名为PaLM、Megatron、Titan和Chinchilla等。那位伦敦科技公司的老板表示,即使他也在追求运用AI,他也“对AI带来的生存威胁感到难以置信的紧张”,并且“每天都在与[其他]创始人谈论它”。美国、欧洲和中国的政府都开始考虑制定新的法规。一些知名人士呼吁暂停AI的发展,以免软件以某种方式失控并损害甚至摧毁人类社会。若你想把对这项技术的担忧或兴奋调整到恰当的程度,不妨首先了解它是怎么来的、它的工作原理,以及它发展的局限性。... ...
LLM实际上是一项庞大的统计学操作——它是如何工作的? LLM只会以统计而非语法的方式来理解。它更像是一个算盘,而不是一个头脑 LLM的输出并不完全可预测;OpenAI研究员已经在各种不同的LLM中统计到了137种所谓的“涌现”能力 涌现的能力令人兴奋,因为它们暗示了LLM尚未开发的潜力——但也可能意味着风险 很难判断哪些有害行为可能处于休眠状态,等待着规模扩大一点时被释放出来 LLM的注意力网络是从如此海量的数据中学习的关键
《经济学人·商论》持续关注全球大趋势,欢迎订阅浏览。订阅商论,即可免费加入【主编领读社群】获取完整解读
🎉订户专享福利
主编领读 · 订户专属社群
✓每日主编精选文章推送 & 主编解读
✓与商论主编沟通交流
* 后台回复“商论入群”即刻体验主编领读!
全年商论英语学习社区
✓译者领读
✓每日一词+学人习语+译者课堂持续更新
海量商论中英双语往期内容
✓超过3000篇双语文章+译文
✓超过一万分钟主播朗读原文
✓双语纪录片
*入群方式:完成订阅 - 关注微信服务号【经济学人全球商业评论】并后台回复关键词“订户入群” - 添加小助理企业微信等待审核后被邀请加入商论订户专属群
微信扫码关注该文公众号作者