自从OpenAI推出ChatGPT以来,这个基于GPT-3.5架构的语言模型迅速成为互联网上最耀眼的新星,作为生成式AI领域首屈一指的“引航员”,ChatGPT不仅在技术上展现了强大的能力,还因其广泛的应用领域而受到资本的高度关注。从那时起,科技圈及创投圈纷纷关注起AI世界,从“谷歌发布Bard AI聊天机器人”到“微软向OpenAI投资了惊人的100亿美元”。就在大家费劲心思试图追赶上GPT-3.5的时候,OpenAI很快迭代升级发布了GPT-4。不过,就在GPT-4仅仅发布几个月后,本就遥遥领先的OpenAI又欲发布新一代语言模型——GPT-5。就在2022年末ChatGPT爆火的几个月后,OpenAI就紧密发布下一代模型GPT-4,GPT-4在GPT系列的先前语言模型基础上带来显著的升级,特别是逻辑推理方面。(截图由Sabrina Ortiz/ZDNET提供;显示了GPT-4在智力上的显著提高)
虽然GPT-4仍然不了解2021年后的事件,但它拥有更广泛的通识知识,对我们所生活的世界了解更充分。具体来看,GPT-4实现了这几个方面的提升:文字输入限制提升至2.5万字,并进行长篇文章的分析和交叉检查。不仅如此,GPT-4还具备了“识别”图像和图表的能力。另外,关于回答准确性显著提高,并且能够生成歌词,实现多样化的文字风格。尽管GPT-4具备令人印象深刻的技能,但了解它的人寥寥无几,尝试过的人更是屈指可数。这主要是因为使用GPT-4需要订阅ChatGPT Plus,每月20美元的费用相比免费的GPT-3.5更是“贵了”些许。(图源:Future /Getty Images)
无论如何,美国科技公司在AI领域的竞争如火如荼,创新的脚步也一直向前。正如AI企业Cohere选择绕开OpenAI的优势赛道,着重解决B端企业用户的痛点(如内部数据安全、高性能、个性化),打造自己的护城河和安全垫。也正如谷歌针对GPT-4的痛点下手,宣布推出多模态Gemini语言模型,据说是AlphaGo和类GPT-4大模型的“二合一”,让市场认为其可与GPT-4相媲美,因此如果OpenAI希望保持领先地位,就必须迅速采取行动。据Windows Latest报道,OpenAI在7月18日向美国专利商标局(USPTO)提交“GPT-5”最新商标申请,虽然商标仍等待美国专利商标局的审查。这意味着OpenAI的下一代语言模型——GPT-5正在路上。根据商标的申请信息显示,GPT-5被描述为“可下载的用于使用语言模型的计算机软件”,在此前GPT-3.5和GPT-4的商标申请中也使用了相同的描述。在申请信息中,GPT-5的具体用途包括:用于人类语言和文本的生成;将音频数据文件转换为文本;语音和语音识别;共享用于机器学习和预测分析的数据集;基于机器学习的语言和语音处理等。然而,关于GPT-5的具体功能和发布并没有透露更多细节,开发者Siqi Chen表示:“我被告知GPT-5计划于今年12月完成训练。”
他还表示,GPT-5可能有能力实现通用人工智能(AGI),即系统可以完成人类无需明确训练即可完成的任何智力工作的程度。如果GPT-5达到这个阶段,就有可能大大提高生产力并使复杂的认知过程自动化。以下是市场各界人士对GPT-5的变革性功能进行的预测:1)多模态能力:GPT-4已经可以处理图像和文本输入,但我们仍在等待音频和视频模态。我们已经看到谷歌开始尝试多模态AI,为医疗应用开发其PaLM 2语言模型的分支版本。OpenAI在竞争的压力也很可能会进行创新。2)更真实:像GPT-5这样的下一代语言模型可以增加其训练数据集的大小和多样性。尽管GPT-4比其前身表现更好,但它对于晦涩的科学概念和较为陌生的主题仍了解不多。在缺乏知识的情况下,大型语言模型往往会产生虚构或回答虚构信息。3)通用人工智能(AGI):OpenAI继续与第三方服务进行合作集成,这将让GPT-5实现通用人工智能。例如,根据客户的预算和饮食偏好,AI会自动在互联网上搜索食谱,购买所需的食材,并将其送到住处,这将使我们更接近通用人工智能(AGI)。4)增加上下文记忆:目前,ChatGPT是根据对话来建立上下文的,但这种上下文是暂时的,并且对消息数量有限制。已经有一些选项可以记住用户的偏好,但GPT-5的目标是扩展这些可能性,这将使GPT-5能够根据用户的历史问题进行文本和回答上的调整。论及GPT-5的发布时间,市场分析,OpenAI开发GPT-4就花费了两年多的时间,如果GPT-5开发周期类似,那么可能要到2025年才能看到GPT-5问世。但这并不意味着我们会一直停留在GPT-4的技术上,因为很可能OpenAI会继续改进GPT-4,甚至发布GPT-4.5版本来作为GPT-5过渡。据悉,GPT-3.5有1750亿参数规模,至于GPT-4的参数规格,虽然OpenAI没有公布,但市场分析GPT-4总计约有1.8万亿参数,是GPT-3.5的10倍规模!很难想象,GPT-5会有怎样的飞跃?会不会参数规模超十万亿?虽然这项技术尚未正式推出,但商标注册申请信息中的描述显示,GPT-5在语言和语音能力具有颠覆性的潜力,这也是埃隆·马斯克等知名人士在三月份呼吁暂停AI的原因。今年,GPT-4的发布,让大家见证了生成式AI的快速发展及其强大功能,但与此同时,AI发展的不确定性、GPT-4令人印象深刻的仿人类能力,触发了人类对于未知事物的恐慌情绪,包括埃隆·马斯克和史蒂夫·沃兹尼亚克在内的一些著名人士开始警告AI的危险性,并呼吁停止训练“比GPT-4更先进”的模型,他们还建议科技巨头至少在六个月内停止进行AI竞赛。作为回应,OpenAI也宣布了不打算训练GPT-4的后继模型,甚至在2023年6月,该公司的CEO还确认公司未来不打算训练新的模型。在印度的某次会议上,OpenAI的CEO表示:“我们正在努力提出我们认为需要的新想法,但我们肯定不会立即开始训练新模型。”但最近注册商标的事件,显然暗示了OpenAI意欲发布GPT-5的想法。而且在AI竞争激烈的当下,各科技巨头显然不会放缓AI模型的开发速度。不过,从科学界对GPT-4的忌惮,我们可以看到目前AI技术的发展速度及应用功能之强大。可以想象的是,随着人们对GPT-5等下一代AI聊天机器人技术的期待,AI技术突破的竞争态势将会愈演愈烈,不知在科技界和创投圈又会掀起怎样的波澜?AI头部公司竞争格局风云诡谲,但总体来说,具有资金和技术的头部科技公司更具有竞赛优势,对于AI行业的投资应多元化配置头部企业,涉及各领域、赛道、策略,紧跟第四次工业革命的顺风车,共享时代变革的红利。