ChatGPT 之父最新专访:发现 GPT-4o 惊喜用途,下一代模型可能不是 GPT-5公众号新闻2024-05-17 10:05GPT-4o 的发布又一次惊艳了全世界,而 Ilya 的辞职也引起了热议,甚至是被视为一个时代的结束。就在 Ilya 辞职之前,有着「ChatGPT 之父」称号的 OpenAI 的联合创始人兼首席执行官 Sam Altman 接受了专访。访谈中,Sam 从 GPT-4o 的使用体验,到 GPT-5 出现的时机与新形式,以及 AI 为企业和个人带来的机会,为我们揭示了不少发布会的幕后细节,对人工智能助理的前景表达了自己的兴奋和忧虑。 原视频链接:https://www.youtube.com/watch?v=fMtbrKhXMWc&ab\_channel=TheLoganBartlettShow以下是采访全文:GPT-4o 让我爱不释手Logan:欢迎来到《Logan Show》,这是一档与科技领域领导者和投资者对谈的节目。本期你将听到我与 OpenAI 的联合创始人兼首席执行官 Sam Altman 的对话。我们将会深入探讨与近期非常热门的人工智能相关的多个话题,以及 OpenAI 的发展方向,还有 Sam 对于 AI 这一前沿领域的看法。Logan:好的,让我们从轻松的问题开始。在执掌 OpenAI 的过去四五年间,你生活中发生的最大改变是什么?有没有什么不同寻常的改变呢?Sam:发生了很多,其中最奇怪的就是我无法再在公共场合当个「小透明」。如果之前听到这种话,我可能只会觉得「好吧,是有点奇怪」,实际上它比想象中更奇怪,这是一种很奇特的孤立的生活状态。Logan:你曾经非常坚信人工智能和商业的力量,那么你难道没有想过执掌这样一个公司可能带来的连锁反应吗?Sam:我没想到很多事情,比如公司会成为一个非常有影响力的公司,更没想到仅仅是在自己的城市出去吃个晚饭都会变得如此困难,这真的很奇怪。Logan:不久前,你刚发布了多模态模型 GPT-4o。它可以跨越文本、语音和视觉工作,你能解释一下多模态的突破为什么很重要吗?Sam:因为我认为多模态的方式是使用计算机的一种革命性的飞跃。实际上,我们很久以前就有了语音控制计算机的想法。你知道的,我们有 Siri,之前还有其他类似的技术,但它们从来没有让我感觉到使用起来很自然。但 GPT-4o 这个技术,由于多方面因素的结合——它的功能、速度、增加的多模态支持、语调的自然性等——让使用体验大大提升。你可以轻松地调整说话速度或改变声音,它的流畅性和灵活性让我非常喜欢。Logan:Spike jonze(电影《Her》的导演)会对它感兴趣哈哈。有没有什么特定的使用场景吸引了你?Sam:嗯,虽然我才用了一周左右,但有个特别惊喜的用途是:在我全神贯注工作时,将手机放在桌子上。然后在不需要切换窗口或停下我的工作,就能够将 GPT-4o 作为一个新的信息渠道。这样我就不需要打断我的工作流,就可以询问它并得到答案,这很不错。Logan:那么,这一切的背后是架构上的变革还是更多的算力?Sam:其实这就是我们在过去几年间在研究中的积累,我们一直在研究音频模型,我们一直在研究视觉模型,我们也一直在尝试把它们结合起来,我们还一直在寻找更高效地训练模型的方法。这并不是说我们发现了某个革命性的新技术,而是所有这些的结合。一次性把所有技术拼凑在一起确实不简单。Logan:考虑到延迟的问题,你觉得是否需要开发一种在设备上运行的模型,以减少延迟,达到实用性所需的水平?Sam:对于视频来说,处理网络延迟可能会成为一个难题。我一直对 AR 眼镜这种能实时与世界交流、感知事物变化的东西情有独钟,但网络延迟可能会让这变得很困难。不过,两到三百毫秒的延迟,人会感觉非常快,在很多情况下这个延迟比人类的响应速度更快。Logan:好的,你最近提到了下一次的大型发布活动可能不会是 ChatGPT 5。似乎有一种迭代式的模型开发方法正在被你们采用。我们可以这样理解吗?Sam:未来发布的大模型可能不会是一个标志性的大版本,如 GPT-5,我确信我了解到的一点是,AI 和惊喜不是很搭。虽然,你知道科技公司通常遵循发布产品的传统方式,但我们可能应该采取不同的策略。现在,我们仍然可以称它为 ChatGPT 5,并以不同的方式发布,或者我们可以考虑其他名称,但我认为我们还在摸索如何为这些东西命名和定位。我觉得以 GPT-1 到 GPT-4 这样的命名是合理的,但现在很明显 GPT-4 已经有了很大进步。我们也有这样的设想,可能会有一种潜在的像是「虚拟大脑」一样的基础模型,在某些情况下,它可能比其他情况进行更深入的思考,或者可能是探索不同的模式,但用户也许并不在意它们是否存在差异,我认为我们还不知道如何让这些产品在市场受到青睐。Logan:这是否意味着,计算在模型上取得增量进展的需求可能比以往要少?Sam:我更倾向于认为,我们会尽可能地利用我们能获得的所有计算资源。我们现在正在取得难以置信的效率提升,这非常重要。你知道,今天我们发布的一个很酷的功能显然是语音模式,但或许最重要的是我们做到了如此高效,以至于我们能够向免费用户提供服务,达到世界顶尖的水准。任何想免费下载 ChatGPT 的人都可以得到它,而且它相对于 GP4 和 GP4 Turbo 在某些场景有了显著的效率提升。我们在这方面还有很多进步的空间。当我们从几十年后回望,会说:「某些事情改变了」Logan:我听说你提到过 ChatGPT 实际上并没有真正改变世界,但可能只是改变了人们对世界的期待。Sam:是的,我不认为你可以从任何经济指标中找到太多证据表明 ChatGPT 真的影响了生产力或其他领域,或许客户支持或某些特定领域是例外。但如果你查看全球 GDP,你能发现 ChatGPT 发布的影响吗?恐怕不行。Logan:会不会存在一个我们可以明确地看到 GDP 增长的时间节点?Sam:我不确定是否能够说这是因为某一个模型的影响,但我认为如果我们从几十年后回望,会说:「嗯,某件事情改变了。」Logan:在接下来的 12 个月里,我认为哪些应用或领域最有前景?Sam:我可能会因为所在领域的限制,存有一些偏颇,但我认为编程是一个非常重要的领域。Logan:关于「惨痛教训」,你最近也花了一些时间进行讨论。你曾详细讨论了深度专业化模型与通用模型的主要区别在于,专业化模型是为了特定的数据和目的训练的,而通用模型则具备真正的推理能力。Sam:我相信,未来真正有影响力的将是通用模型。如果一个能进行通用推理的模型发现新事物,那么当需要处理新类型的数据时,我们只需提供新的数据,它就能够适应并处理。但专业化模型在这方面是不可能的。我认为许多专业化模型组合在一起,也无法进行通用推理。所以,编写特定模型的重点可能在于,我认为我们最应该弄清楚的是真正的推理能力,然后我们可以将其应用于各种场景。自然语言是人和 AI 之间很好的交流方式Logan:你认为未来两年内人类与 AI 之间的主要交流方式将是什么?Sam:自然语言似乎是一个很好的选择。我对这个想法很感兴趣,那就是我们应该设计一个人类和 AI 可以共同使用的未来机制。我对类人机器人比其他类型的机器人更感兴趣,因为我觉得现在的世界是为人类设计的,我不想让它为了某种更高效的模式而被重新设计。我喜欢这样一个想法,即我们用非常适合人类的语言与 AI 交流,它们甚至也可以用这种方式相互交流,这个想法可能还有待探索。尽管无法预知未来,但我认为这是一个值得推动的有趣方向。Logan:你最近提到,随着时间的推移,模型可能会变得越来越走向大众,但最重要的可能会是关于模型的个性化,我理解你的意思了吗?Sam:我不是很确定,但我觉得这听起来很有道理。Logan:那么,除了个性化,你认为最终对用户而言,普通的商业用户界面和易用性最终会成为胜出的关键吗?Sam:这些因素当然很重要,它们总是如此。我可以想象还有其他因素,但我认为,常规的商业规则仍然适用。每当出现新技术时,我们总是很容易认为旧规则不再适用,但这种想法通常是错误的,传统的创造和流失价值的方式如今仍然很重要。Logan:当你看到开源模型开始追上基准标准的时候,你怎么想?Sam:我觉得这非常好。我认为,就像其他技术一样,开源将有其一席之地,托管模型也是如此,这很好。我不会询问任何具体的细节,但已经有媒体报道关于筹集大量资金的消息。华尔街日报是其中一个可信的报道来源,这些资金是为了在半导体行业激励投资。像台积电和 Nvidia 这样的公司一直在积极扩张,以满足对 AI 基础设施的期望。Logan:你最近说过你认为世界需要远超目前水平的更多 AI 基础设施。那么,你是不是观察到需求端有些什么需要比我们目前从台积电和 Nvidia 获得的更多的 AI 基础设施?Sam:所以首先,我有信心我们会找到方法降低现有系统的成本。其次,随着成本的降低,人工智能系统的需求必然激增。我相信,通过打造更大更强的系统,需求将会进一步飙升。我们都应该期待一个智能资源廉价到不需计价的世界,在那里,智慧资源丰富到人们可以随意使用,甚至不用考虑太多。比如说,我是希望它帮我阅读回复所有邮件,还是用来治疗癌症?当然,治愈癌症更重要,但理想情况是两者都能实现。我关注的是确保我们拥有足够的资源,让每个人都能享受到智能技术带来的益处。Logan:我想请教你对于Humane、Limitless等公司推出的不同物理设备助手有何看法?你认为它们有哪些不足之处,或者为何它们的普及程度尚未达到预期的用户需求?Sam:我认为它们都太早期了。我一直是多种计算设备的早期用户,有着丰富的使用体验。我曾经拥有并非常喜欢 Compaq TC1000,觉得它超酷,那是我大学新生时期的事了,它与 iPad 相比还有很长的路要走,但方向是对的。后来我又用上了 Treo,我用的是老款的 Palm Treo,那时候孩子们并不会拥有它,而它与 iPhone 相比也有很长的距离。但最终我们还是实现了。这些设备似乎朝着一个非常有前景的方向发展,只是还需要一些时间的打磨和技术的迭代。适应 AI 进步:建立有长期竞争力的企业Logan:你最近提到,很多在 GPT-4 上构建的业务在未来将会被更先进的 GPT 技术「碾压(steamrolled)」。你能详细解释一下这个观点吗?谈到 AI 领域的企业特点,哪些企业能在 GPT 的不断进步中生存下来?Sam:我发现的有效方法是,在构建业务时,你其实是在做两种选择:要么赌下一代模型不会太出色,要么就是赌模型会更进一步,并从中受益。举个例子,如果你投入大量努力,仅仅是为了让某个应用案例勉强可以运作,这个应用案例恰好是 GPT-4 所不能处理的。然后当你终于成功时,但后来 GPT-5 出现了,并且它能够更出色地完成这个任务以及其他任务,那么你之前为那个单一案例所做的努力可能就会感到有些尴尬了。但如果你有一个产品,在各个方面都表现得还不错,人们自然会去使用它,而你并没有投入大量精力去实现某个特定功能,然后 GPT-5 或者其他名称的模型出现了,表现得更好,你就会享受到「水涨船高(the rising tide lift at all your boats effect.)」的影响。我想说的是,大多数情况下你不是在创建一个 AI 企业,而是在创建一个业务,AI 只是你采用的一种技术。在应用商店的早期阶段,有很多产品填补了某些明显的空缺,但随后苹果解决了这个问题,我们现在已经不再关注应用商店里的手电筒应用,因为它们的功能已被集成到操作系统中。这将是未来人工智能业务可能的发展方向。然后有些应用,比如 Uber,它们虽然是由智能手机的普及带动的,但实际上它建立了一个非常稳固且长期可行的业务模式,我认为这正是我们应该追求的方向。Logan:我明白你的意思,而且我能想象出很多应用你们技术理念的企业,它们在某种程度上都符合这一框架。那么,你能否给出一个具体的例子或新型概念,它符合我们之前讨论的模式?例如,Uber这样的公司,它不必是一个真实存在的企业,即使是一个假设性的公司、一个玩具概念,或者只是你认为以这种方式实现的某个想法也可以。Sam:我更倾向于押注那些新兴的初创企业,一个典型例子是,当人们尝试创建类似于人工智能医生的人工智能诊断工具,人们常说,「我不想在这个领域创业,因为像梅奥诊所(Mayo Clinic)等知名机构肯定会做这件事」,但我更倾向于认为会有新公司涌现出来做这样的事情。Logan:对于那些想要主动准备迎接这些巨大变革的 CEO,你有何建议?Sam:我敢打赌,智能作为一种服务,每年都在变得越来越好、越来越便宜,这是取得胜利的必要条件,但并不足以让你取胜。大公司虽然需要时间来做到这一点,你可以借此优势超越它们,但同样意识到这一点的其他创业公司也会这么做。所以你需要搞清楚让你的业务长期保持竞争力的策略。现在的竞争环境比往常都要开放,有许多令人兴奋的新事物等着去做,但这并不意味着你可以忽视打造核心价值这一艰苦的过程,尽管现在有更多种方式可以实现。Logan:鉴于人工智能的飞速发展,你能否预测在未来五年内可能涌现或成为主流的新职位类型?这些职位可能是当前鲜为人知或尚未存在的。Sam:这是一个很棒的问题,我以前从未被问及过。人们总是问,什么工作会消失,但提问新工作更加有趣。让我想可能有1亿或5千万人可能会涉足的新领域。这可能涉及全新的艺术形式、娱乐方式,以及更加注重人与人之间的联系。虽然我不知道这些职位的具体名称,也无法确定我们是否能在五年内达到这样的规模,但我认为面对面的体验将会变得非常珍贵,可能会形成一个新兴的巨大市场。我们可能会见证断崖式的技术飞跃Logan:OpenAI 最新的公开融资估值大约是 900 亿美元。除了 AGI,你认为还有哪些里程碑能让 OpenAI 成为一个万亿美元的公司?Sam:我相信如果我们能持续以目前的速度改进技术,并且继续开发出好产品,收入也会继续增长。我不确定具体的数字,但我认为我们的前景是光明的。至于目前的商业盈利模式是否能创造 1 万亿美元的股权价值,订阅模式对我们来说很有效。虽然我原本对此并不抱有太大期望,但结果却相当不错。Logan:至于 OpenAI 目前的结构,虽然不想老调重弹,但你提到了途中的一些改变,你认为未来更适当的结构是什么?Sam:我认为我们已经准备好了讨论这个问题,我们一直在积极探讨和头脑风暴。我希望在今年内,我们能够就此进行更深入的交流。Logan:嗯,一个有趣的点是,关于人工智能的既定印象,有一个特别有趣的话题是你的货币化模型观点。我们曾听你提及,首先是取代体力劳动,然后是白领工作,最后是创意工作。但显然,事情与预期完全相反。是否有其他出乎意料之外的事情呢?比如,我本以为会是这样,但实际上却是完全相反的情况。Sam:这对我来说确实是一个巨大的意外。除了你提到的那一点,还有其他一些事情,比如我没想到人工智能会如此擅长法律工作,并且会这么早就展现出这样的能力。因为我一直认为法律工作是非常精确和复杂的。Logan:对于那些还没有听你讲过 AGI,以及你为什么不喜欢这个术语,你能详细解释一下你的观点吗?Sam:因为我知道AGI不再是一个明确的时间点。显然,当你创办一家公司时,你会有很多天真的想法,特别是在这样一个快速发展的领域。OpenAI成立之初,我也曾天真地认为,我们将从没有AGI的时代开始,然后实现AGI,这将是一个真正的飞跃。我仍然认为可能会有一些突然出现的飞跃式发展,但总的来说,我认为它还是会像一个持续增长的曲线一样呈现波动上升的趋势,关键是进步的速度。你和我可能不会在具体的月份或年份上达成一致,到那时我们会说好吧,现在这就是通用人工智能了。我们可以设计其他测试,我们或许会对此达成共识,但是即使这样,事情比表面上看起来要困难得多。你知道,当前的 GPT-4 显然还没达到普遍意义上的 AGI水平,我也不觉得我们下一个大型模型会达到。但我可以想象,我们可能只差一两个创新的想法,再加上一些规模扩展,就能创造出一些让我们觉得真的不一样的东西。我认为,对此保持警觉是很重要的。Logan:是否有更现代的类似图灵测试,我们可以称之为巴特利特测试呢?Sam:当它达到某个阈值时,我认为,如果它能够进行比所有 OpenAI 研究人员甚至是一个 OpenAI 研究人员更优秀的研究,那将是一个非常重要的标志。但这样的进展是否即将到来,目前还不太确定,但我不会完全排除这种可能性。Logan:你认为达成 AGI 的最大的挑战是什么?听起来你认为目前的规模化原则可能还行得通,至少在接下来几年内是这样。Sam:是的,我认为最大的障碍是需要新的研究。你知道,我从互联网软件转向 AI 的过程中不得不学到,研究并不像工程那样有固定的进度表。这通常意味着它需要更长的时间,并且不总是有效,但有时候它的进展速度却又远超任何人的预期。Logan:能不能详细解释一下,为什么它的进展不是线性的呢?Sam:我想,通过历史例子来解释可能是最好的方式。嗯,我记得中子最初是在 20 世纪初被理论化,大概在 20 年代首次被探测到,关于原子弹的研究始于 30 年代,并在 40 年代取得了成果。从几乎没有任何关于种子的理论概念,到能够制造出原子弹,甚至彻底动摇我们对物理学的直觉,这样的速度简直令人震惊。还有一些不那么纯粹属于科学的例子,例如关于莱特兄弟曾在在 1906 年他们认为人类飞行还要 50 年,然后在 1908 年他们就实现了飞行,类似的例子在科学和工程领域比比皆是。当然,也有很多我们预测的事情从未发生,或者比我们预期的要花费数十甚至数百年的时间更久。但有时候,进步确实是突飞猛进。Logan:关于可解释性,我们目前在这一领域处于怎样的位置?它对人工智能的长期发展有多关键?Sam:可解释性有不同的层次,包括我是否理解网络在机械层面上的每一层运作方式,或者我是否能够通过查看输出来指出其中存在的逻辑错误。我对OpenAI以及其他机构在可解释性方面的研究充满期待。我认为,作为一个更广泛的领域,可解释性具有巨大的潜力和令人兴奋的前景。Logan:我不会催你,但我想你们在准备好要宣布什么的时候,会有一个精彩的公告。这里还有几个问题,随着人们对AGI的期待日益高涨,关于OpenAI等组织单方面利用其并做出决策的担忧也在增加。这促使一些政府机构介入,希望由选举产生的领导者来做出这些决策,而非完全依赖OpenAI等公司。Sam:是的,我认为对于像我这样的人来说,严格规范现有模型能力将是个错误。但当模型对世界构成重大的灾难性风险时,我认为实行某种监督措施可能是件好事。目前,如何设定这些风险的阈值以及如何有效测试它们,我们确实还仔细权衡。如果因为过度担忧潜在风险而限制了这项技术的巨大优势,让那些希望在自家地下室训练模型的人望而却步,那将是一个巨大的损失。但话说回来,如果我们用国际核武器规则作为参照,我认为对人工智能进行某种形式的监管是合理的。Logan:嗯,你认为他们没有看到人工智能中潜在的风险吗?Sam:我认为他们就是没有整体上认真考虑过 AGI。但我确实同情他们的立场,像看看欧洲的技术产业发生了什么,我理解,我真的理解。然而,我认为有一条我们正在接近的界限,超过这个界限,我们可能都会有不同的感受。Logan:你认为开源模型本身就存在固有的危险吗?Sam:目前没有哪个模型是这样,但我可以想象将来可能会有。Logan:我听你说过,安全在某种程度上被当作了一种错误的框架,因为它更多地关注我们明确接受什么。Sam:确实如此,这并不是一个非黑即白的事,就好比你愿意坐飞机,因为你觉得它们相对安全,尽管你知道它们偶尔会出事。那么关于什么样的航空公司才算安全,这个问题有许多讨论,每个人的看法都不尽相同,这是个当前的热门话题。航空业已经变得极其安全,但安全并不意味着绝对没有人在飞机上丧生。同样,医学领域我们也非常重视副作用,因为有些人会对药物产生不良反应。此外,安全还有其隐性的一面,比如社交媒体可能带来的负面影响。Logan:你能想象在什么情况下,你会在安全范畴上做出与推进相反的决策呢?Sam:我们有一个叫做「准备框架」的东西,就是为了针对这些,也就是在特定的类别和层面上,我们的行动策略会有所不同,以应对潜在的风险和挑战。Logan:考虑到众多快速涌现的应用场景,我认为我们当前面临的一个主要瓶颈是人工智能基础设施的不足。假设有研究人员对现有的神经架构Transformer进行了某种突破性的改进,使得所需的数据量和硬件大幅减少,甚至接近人脑的水平,那么你认为这是否会加速「技术飞跃」?Sam:当然,这是有可能的,并且可能不需要任何修改。虽然我认为这并不是最有可能发生的情况,但我并不完全排除这种可能性,重要的是,我们要在可能发生的各种情况中考虑到这一点。我认为,即使技术发展在加速,这个过程也会是渐进的。我不认为我们可能某天睡觉时还处在初步的人工智能阶段,然后第二天醒来就面对真正的超级智能。但即使技术突飞猛进仅发生在一年或几年之内,那也算是相当快速了。另一个要考虑的是,即使我们拥有了真正强大的AGI,它在短期内对社会的影响也是有限的。我猜测,大多数情况下,它不会在一年或两年内产生足够大的影响,但在十年内,世界绝对会发生巨大的变化。在这方面,社会的惯性实际上可能是一个积极的因素。多年后,人类仍然会关心其他人类Logan:嗯,你追求AGI的动机是什么?抛开股权不谈,即使我相信大多数人都会觉得,即使他们追求的是更高的使命,得到相应的报酬也会是一种安慰。那么,你每天来工作的动力是什么?你又从哪里获得最大的满足感?Sam:我一直对人们说,我现在愿意做很多其他生活上的调整和牺牲,因为我认为这是我将会接触到的最激动人心、最重要、最好的事情,这是一个充满变革的时代,我很高兴这不会永远持续下去。你知道,将来某天我可以退休去农场,我会怀念这段时光,但会想,哦,那些是压力很大、非常漫长的日子。但这也是非常酷的,我简直不敢相信这些事情真的发生在我身上,这就像是不可思议的奇迹。Logan:我们回到那个你因名气而不能在自己城市出门的例子,是否有过一个最超现实的瞬间,那种让你惊叹:「哦,天哪」的瞬间?让你感到仿佛置身于一个超现实的场景之中?Sam:每天都会有一些事情让我惊叹。比如那个星期(去年11月份被董事会罢免),我收到了来自世界上一些重要人物,如总统、国家总理等的10到20条短信,但这并不是让我感到奇怪的部分。让我感到真正奇怪的是,当这一切发生时,我像是在正常地回应他们,发送“谢谢”之类的信息,感觉一切都非常自然。我们度过了那四天半疯狂而紧张的时光,我几乎没有睡觉,也没有怎么吃东西,但我的精神却出奇地好,头脑清晰,极度专注。几乎每天都有那么一些事情,让你惊叹,如果我能稍微腾出一些心思去回想,这就会觉得太疯狂了。有点像鱼儿在水里的感觉,但是,是的,就是那种效果。Logan:所以,当你想到模型变得越来越智能,你之前稍微提到的那样,关于创造性方面,在你看来,随着人类和大模型开始承担更多过去仅由人类完成的任务,哪些特质或能力仍将是人类所独有的呢?Sam:我相信,即使很多年之后,人类仍然会关心其他人类。我在网上稍微搜了一下,大家都在说,「哦,现在大家都会爱上 ChatGPT 了」,大家都会谈论 ChatGPT 女友什么的。我敢打赌不会,我认为我们内心深处非常关心其他人,无论是大事小情,以各种不同的方式,这种对人的关心将会持续存在,我们对他人的关心几乎可以说是一种固有的执着。虽然你可能听说过许多关于人工智能,但我想不必在意,毕竟我们不会把观看机器人踢足球当作主要的娱乐爱好。人和 AI 助手的分离是有价值的Logan:当你管理 OpenAI 公司时,你在制定了很多运营企业的规则或框架,然后你同样打破了许多规则。OpenAI 是否引入了不同类型的高管?或者你是根据不同的特质来招聘的?Sam:我通常并不倾向于从外部聘请高管,但我认为,如果公司总是仅从内部提拔高管,可能会导致公司文化的单一化。我认为公司需要引入一些新的高级人才来注入活力。但在这里,我们主要还是依赖本土人才,考虑到我们所做的与其他地方的工作很不同,我认为这是一件好事。Logan:在 OpenAI 的发展过程中,有没有一个决策在你做出的时候感觉特别重要?Sam:很难只指出一个,或许有一个就是:我们决定采用所谓的迭代部署策略,也就是我们不会秘密地构建 AGI 然后一次性发布到世界上,这是过去的普遍看法,这是当时许多公司和人们的普遍观点和计划。但我认为这个决定非常关键,而且在当时看来确实非常重要。Logan:关于押注语言模型的背后故事我一直很好奇,这一决策是如何产生的?Sam:嗯,当时我们团队正专注于多个项目,包括机器人开发和视频游戏。然而,在这个多元化的背景下,一个相对较小但充满热情的团队开始投身于语言建模的研究。伊利亚(Ilya Sutskever,OpenAI前首席科学家)对此方向深信不疑,他坚信语言模型的发展潜力,最终成了我们专注的语言模型。于是,我们着手进行 GPT-1 的开发,接着是 GPT-2,我们深入研究了缩放定律,进而升级到了 GPT-3,然后我们做出了重大决策,决定将作为我们的主攻方向。尽管事后看这些决策似乎显而易见,但在当时,确实是一个经过深思熟虑的决策。Logan:你最近提到了关于 AI 的两种不同方法:复制自己和打造最聪明的雇员。Sam:这并不是关于 AI 本身,而是关于你想如何使用 AI,当你想象使用你的个人 AI 时。Logan:能否请你进一步详细解释呢?因为我认为这对你关于未来人工智能用例的思考具有深远的影响,你能再次解释一下那个观点吗?Sam:当然。当我在未来五年内收到你的短信时,我希望能够清楚地知道,这是你直接发给我的,还是由你的人工智能助手代为转发的。我认为保持人和 AI 助手的分离是有价值的,AI 助手也不能简单地认为完全是人的延伸。对我来说,我不想感觉这个东西只是我身上的一个奇异附属物,而是一个可以跨越障碍与我沟通的独立实体。你在音乐或创意领域就能看到这一点,复制德雷克或泰勒·斯威夫特的音频变得很容易,因为我们可能需要某种验证机制或系统来确认,这确实是某个人的创意作品,个人层面大概也是如此。当我们思考教育体系,想象一下 2030 年或 2035 年的大学新生,或者未来的某个群体,大学教育体制中应该做出哪些具体改变来为未来做好准备,我认为最重要的一点是,学生不仅应该被允许使用,而且应该被要求使用。在使用这些工具时,有时候我们更倾向于让人们采取传统方式行事,因为这样有助于加深理解。我还记得在数学课上,有些时候你不能在考试中使用计算器。但实际上,在现实生活中,你是可以使用计算器的,因此你需要理解它的原理,并且要能熟练操作计算器。如果你在数学课上从没用过计算器,那你在以后的工作中会遇到困难。如果 OpenAI 的研究人员都不使用计算器,那么 OpenAI 可能至少在计算机方面不会取得如今的成就。我们不会教导人们不使用计算器或电脑,同样,我认为我们也不应该训练人们不使用 AI。AI 将成为未来从事有价值工作的重要组成部分。Logan:最后,在规划通用人工智能(AGI)及其未来时,你曾写道第一个 AGI 只是智能连续体上的一个节点,我们之前讨论过这个话题。Sam:我们认为,从那一点开始,进步可能会持续,未来很长一段时间内可能会保持过去十年的发展速度。Logan:那你是否曾经私下停下来思考未来会是什么样子?或者是否它太过抽象,以至于已经无法具体描绘了?Sam:我一直在思考。但我不是说我能想象出有飞行汽车的《星球大战》式未来城市场景,但我确实在思考,当一个人能够完成数百上千个协作无间的人的工作时,这意味着什么?当我们能够探索到所有科学领域时,那会是什么感觉?肯定非常酷。Logan:是的。Sam,感谢你接受这次访谈。微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章