李开复的ChatGPT将走向何方?
编辑| Tian
出品 | 青投创新
在王慧文宣布进军人工智能领域,带资5000万美元组建ChatGPT团队后,李开复也宣布将亲自下场筹组AI2.0公司。
3月19日晚间,创新工场董事长李开复在朋友圈发文:我正在亲自筹组Project AI2.0,一个致力打造AI2.0全新平台和AI-first生产力应用的全球化公司,这是一家由技术愿景驱动,拥有卓越中国工程底蕴的创新企业,在全球范围号召世界级的人才,加入我们一起打造这个世界级的公司。
在李开复的计划里,Project Al2.0不单单要做中文版ChatGPT这样的高能聊天工具或是简单的图文创作类AIGC生成,在他看来这些应用都还只是AI2.0能力的开端。
“AI 2.0时代的来临,是巨大的平台式机会,而且这将是中国在AI领域第一次参与平台角逐的机会,比移动互联网大10倍。”李开复选择在此时入局,是想赶在全球人工智能浪潮来临时,通过Project Al2.0面向全球吸纳专注在大模型、NLP、多模态、算法、分布式架构等方向的人才,加速打造Al2.0的全新创业生态。
不过,尽管AI始终是创新工场重点关注和布局的领域,但李开复开创性地推出AI2.0概念,在GPT-4发布后全球科技公司正纷纷在人工智能赛道加速追赶OpenAI之时,Project Al2.0推出的中国版ChatGPT将依旧停留在概念,还是会成为创新工场培育出的下一个独角兽,这是高调入局后,李开复需要考虑的。
All in AI2.0
在朋友圈宣布筹建AI2.0团队之前五天,李开复在创新工场总部鼎好DH3大厦组织了一场AI分享会,用“AI2.0是绝对不能错过的一次革命”定义AI2.0的全新概念之外,高度肯定了其对未来人工智能行业引领与变革性作用的能力。
AI领域始终是创新工场投资与培育的重心,在以深度学习为代表的的AI1.0时代,创新工场已经培育了十家独角兽,而加上Project AI2.0,创新工场的人工智能工程室塔尖孵化也已经培育出七家公司。
研发前沿的人工智能技术、培养人工智能人才并建设人工智能生态、培育人工智能创业项目、促进科研合作和AI科技商业转化、用人工智能赋能真实世界的商业场景,是创新工场对工程室塔尖孵化的愿景描述。
因此与王慧文自称“我目前不懂AI技术”的半路出家相比,李开复算是涉足AI领域很久的资优生。
李开复把AI1.0比作发电,AI2.0是电网,在AI1.0时代,影响了互联网、商业、实体的各种识别功能,以及机器人和自动驾驶的出现,着实改变了人们现实生活状态和产业生态,但缺少主观性。
而AI2.0具有三个特点:第一,无需人工标注,可以阅读海量的文本,进行自监督学习;第二,模型规模大,需要几千张GPU来训练,消耗巨大的数据和资金;第三,拥有跨领域能力,可以通过微调以较低的成本训练,以适应不同领域的任务,从文本延伸到其它。
如ChatGPT这样的生成式AI出现,以更加自主与智能的能力开启了AI2.0时代。生成式AI能够实现无需标注地自监督学习,AI将从辅助人类到逐步“替代”人工,所有使用者界面将被重新设计改写。
李开复在介绍AI2.0时打了个比方,想象让AI读一本书的前九章之后“猜测”第十章,再让AI对比真正的内容,读过上千万本书后,模型不断优化和迭代,以这样的方式,AI变得越来越精准,最终形成适用不同领域的基础大模型。
大模型竞争
GPT-4之所以能够引爆科技圈,是其相比于ChatGPT接入的GPT-3.5,在识图能力、文字输入能力、回答准确性、创意文本、风格多变等方面有了质的飞跃。
像GPT-4这样的多模态大模型对于AI领域的成功与否是有决定性作用的,正如李开复所言,AI2.0就是需要通过对模型的不断优化与迭代,形成多模态模型,才能完成AI的升级。
因此,从AI1.0走向AI2.0实际上是属于大模型的竞争。
以ChatGPT为例,它能够帮助读者获得更加精准的内容,但准确度不如搜索引擎,后者已经可以做到前十条结果点击率超过95%,前三条结果点击率高达80%-85%。
并且ChatGPT的模型是以年为单位训练,不适合处理时效性强的信息。因此,ChatGPT可以看作是一个强适应性、弱准确度、弱时效性的大模型。
凭借微软强大的算力与算法支撑,GPT-4通过多次迭代和改进能够在准确性上做到有效提升,弥补了上一代模型的不足,因此接入GPT-4的ChatGPT才能如此“颠覆”。
大模型实际上可以看作是数据、算力和算法的结合,百度的文心一言被受关注的原因之一就在于百度拥有全球最大的中文数据语料库、飞浆架构、昆仑芯片和文心大模型,完整的产业链都足以保证文心大模型走向成熟。
创新工场孵化出的澜舟科技是国内专门从事AI大模型研发的公司,早在2021年澜舟科技的孟子大模型就在中文语言理解评测CLUE榜单上登顶,用10亿参数级别的轻量化模型击败其他巨头公司百亿甚至千亿参数级别模型。
李开复选择此时入场人工智能,似乎更有道理了。
GPT-4展现出的能力让人们有理由相信AIGC时代已经到来。
AIGC正在越来越多地参与数字内容的创意性生成工作,比如GPT-4可以完成将文字输出成图片、音频、视频,或是将图片和视频转化成自己理解的文字。
数字内容正迈入强需求、视频化、拼创意的升级周期,短视频就是将原本需要长制作周期、高注意投入的视频,变成了可以源源不断产出的工业品和快消品。
不过作为核心的创意仍旧稀缺,需要新的模式辅助创作者持续产生、迭代和验证创意,人工智能发展成熟后,AIGC正好是这种更加低成本、高效能的新工具与方式。
AIGC在基于自然语言的文本、语音和图片生成领域初步令人满意,在视频和3D等媒介复杂度高的领域处于探索阶段,而这一切的基础是多模态,每一个任务与能力之间都是不同模态之间的协同作用成果。
因此多模态就成为AIGC走向的关键因素。
多模态下,一个模态可以补充另一个模态的弱点,从而能够通过融合多个模态的信息,获得更精确的用户、情感、场景等,无论是内容创作、语音合成、影像输出,还是未来虚拟人技术的发展,都需要在多模态技术下实现。
李开复在对AI2.0的描述中,强调了AI对于生产力的提升和变革,无论是他提到的AI与电商广告结合、AI与影视娱乐结合、AI与金融、AI与医疗、AI与游戏等实际上都是在多模态预训练大模型可以实现的AIGC下完成的。
大模型、多模态一定是未来AI2.0的核心关键,李开复信心满满提出AI2.0的概念,势必是创新工场多年在AI行业细分领域布局的成果显现,从这些方面来看,李开复的ChatGPT似乎会比王慧文的靠谱一些。
「往期推荐」
微信扫码关注该文公众号作者