作者:刘润
来源:刘润(ID:runliu-pub)
去年,已经“就那样”了。新的一年,我该怎么把握?世界还会往什么方向变?哪里还有我的机会?去年这个时候,为了回答这些问题,我曾和你一起读过一份报告《看DAO2023》,来自未尽研究。里面聊了很多对新一年技术趋势的展望。比如,它在2022年底聊半导体:“中国半导体行业在2023年需要与时俱进的新一轮产业政策,聚焦制造薄弱环节。” 聊新能源:“未来 5 年新增可再生能源装机,中国将占一半。”2023年初,“国家队”的大基金接连落子,集中在芯片制造行业布局投资。2023年中,国际能源署在报告中指出,今明两年中国将占全球新增可再生能源装机容量的55%。于是陆陆续续,很多读者在后台留言说有意思,有启发。所以今年,我帮你找到了新出不久的《看DAO2024》。2024年,有没有什么我还不一定知道,但其实今年就有可能落地的变化?我的生活哪里会被影响?甚至,有没有哪个变化,可能成为我的机会?带着这个问题,我看完了今年的《看DAO2024》。看完后,我感觉里面提到的几个新变化、新趋势乃至新机会,特别有意思,也特别值得你早点知道。比如,具身智能。空间计算。AI助手。基因编辑。自动驾驶。小模型。AI短剧。没关系,所有的新机会,在一开始都只有少数人看得到,看得懂,抓得住。今天,赶在过年前和你分享,争取让你下次再看到它们时,能觉得眼熟,有所了解,不会错过。从哪里说起呢?先从上周末让很多人激动的一副“眼镜”吧。
空间计算
1月19日,苹果的Vision Pro在美国正式开售。一副的价格,折合人民币定到了2.5万元起,可以抵3台iPhone,可上线还是挤爆了服务器,瞬间被抢空。国内黄牛价,更是被炒到了9万元一副。Vision Pro?什么东西?怎么这么贵,还这么火?先看图。这意味着什么?和我的2024有什么关系?打游戏更炫酷的关系吗?
时间回到2023年,Vision Pro刚刚亮相发布时,苹果公司CEO库克曾难掩兴奋地说了这么一句话:“今天标志着计算技术新时代的开端。如同Mac将我们带入个人计算时代, iPhone将我们带入移动计算时代,Apple Vision Pro将带我们进入空间计算时代。”以后,不管你买不买Vision Pro, 玩不玩VR或AR游戏,你所处的世界,可能要开始进入空间计算时代了。它是元宇宙的基础技术之一,是很多人心中的下一个科技风口。但最重要的是,它是一种可能会彻底改变你和互联网的交互方式的技术:它能让你从在现实世界和数字世界里“反复横跳”的时代,进入到“深度融合”的时代。什么意思?这么说吧,从前,无论是PC时代还是移动互联网时代,无论是用电脑还是用手机,你要上网,是不是都得对着一块东西:屏幕。在屏幕那头的数字世界,你看的小说、发的图片、 刷的直播...大多是2D的。而在屏幕这头的现实世界,你却生活在一个3D的世界。2D的数字世界。3D的现实世界。这两个世界,可能偶尔互有映照,但本质上都不在一个维度,你怎么生活?走路,划几下朋友圈,必须抬头看一眼路。吃饭,刷十集短剧,转头发现天都黑了。总得在两个世界里二选一,进进出出,反复横跳。直到,有了空间计算的技术。反复横跳的时代,有了被颠覆的可能。以后要上网,你可能只需要戴上“眼镜”,进入一个像这样的空间:一边,看得见现实世界的家具环绕着自己,一边,也能看见数字世界的操作界面横贯在半空。
甚至,连屏幕,乃至以前人机交互少不了的鼠标、键盘...都不再是必需品。以后,在空间计算的加持下,你转个眼睛、做个手势,说句命令,就有可能操控一切。从反复横跳,到深度融合。从需要鼠标和触摸屏,到空手操作的人机交互。从“一个屏幕”背后的二维世界,到“一副眼镜”背后的三维世界。
《看DAO2024》提到,巨头们很少再提元宇宙。取而代之的,是针对空间计算的竞争。这场竞争,正处于一个关键时刻。明年有可能会是“空间计算元年”。2023年,Meta发布了Quest3。2024年,苹果发布了Vision Pro。而当这一切变化发生时,电商、社交、娱乐...很多事情也都有了新的机会,值得被重新做一遍。ChatGPT,肯定算一个。还记得去年年初,ChatGPT横空出世,破了最快的用户增长记录,刷了全世界的屏。朋友圈里都在感叹,这个AI聊天机器人,太厉害了。它居然可以和你这么这么聊天,还可以帮你那么那么写稿,甚至还能写代码、考试...看多了像ChatGPT这样的AI聊天机器人后,今年很多人开始聊起一个新词:具身智能。在ITF World 2023半导体大会上,英伟达CEO黄仁勋就曾说,人工智能的下一个浪潮,将是具身智能。直接回答,就是:一个能够感知、理解、推理,并与物理世界互动的智能系统。翻译一下,就是:和ChatGPT一样,同样还是AI机器人,只不过除了有“头脑”,还多了一个“身体”。什么意思?我举个例子。都是AI机器人,你和ChatGPT说你口渴,它可能会在屏幕另一头和你说“喝点水”。但如果你和具身智能说你口渴,他不但能回你一句“喝点水”,还有可能自己迈开腿去找到热水壶,再动动小手帮你烧好,最后把热水倒到杯子里,再送到你手上。不但能在线上的数字世界帮你,还能在线下的物理世界帮你。这也意味着,不但要具备像ChatGPT那样可以陪你“聊聊天”的理解能力,还要同时具备可以帮你“搭把手”的感知、理解、决策、控制等一系列的能力。太了不起了。什么样的机器人,才能同时实现这么多能力啊?《看DAO2024》在此处划了一个重点: 人形机器人。报告提到,二十多年来,人形机器人技术专利的申请量逐步上升,重心逐步从下肢结构与步态控制,转向手臂结构及其运动控制,且有进一步增加的趋势。
“具身”其实可以很接地气,比如,让机器人有手有脚。比如2023年亮过相的人形机器人,身高就大多处在一米五到一米八之间。外表看着亲切,还能更好地融入人类的日常环境。比如,能听懂“人话”,能把“人话”转变成不同的子任务,能适应多种环境,自主与环境交互感知,从而成功执行多种任务。这么厉害的人形机器人,会不会很贵?《看DAO2024》给出了一个判断:不贵。报告指出,生成式人工智能正在加速人形机器人的生长。技术、市场与政策一起发力,催生人形机器人进入量产时代, 比汽车更便宜。
人形机器人,不知疲倦,没有人口危机,长期来看,单位时间成本更低。今年,亚马逊在自己的物流仓库试用了人形机器人 Digit。Digit 计划于 2024 年量产。
这样的机会,属于谁?能设计出强大的智能体系统的人,掌握机器人训练所需的数据的人......但归根结底,属于那些最早看到,并积极拥抱人形机器人的人。中国是世界上最大的机器人市场,国际机器人联合会(IFR)称,供应链企业不断在中国增加产能。
2023年以来,中国各级政府已经开始引导创业者与投资者抓住机遇。从顶层设计、到产业基金、再到政策法规.....当AI有了“身体”,能帮的忙越来越多时,还会有什么机会?2023年底,有一位老人,用一封年度公开信,回答了这个问题。在刚刚过去的2023年年底,比尔·盖茨在一篇博文中预言了这么一个场景:“在不久的将来,任何上网的人都将能够拥有由AI驱动的个人助手,远远超越今天的技术水平。这些代理将能够帮助几乎任何活动和生活领域。”拥有一个AI助手,听起来不错。但是,听起来也很像画饼。有没有什么AI助手,是已经落地成型,真的可能在2024年影响到我的生活的?比尔盖茨的博文,和《看DAO2024》的报告,都把聚光灯打向了同一个方向:医疗健康。你知道,每一天,搜索引擎会接到多少个关于健康的提问吗?谷歌。有10亿个,百度,也有上亿个。每天数以亿计的提问背后,是足以让医院永远人满为患的健康需求。于是,看不完的诊,排不完的队。医生的笑容越来越疲惫,话也越说越简短,病患更是跑断腿,甚至干脆能忍就忍,不必要坚决不去医院。怎么办?不是说科技改变效率吗?有没有什么办法,能让健康医疗行业也可以降本增效,变得更规模化,让所有人都受益?你有没有发现,拍片化验、望闻问切...很多医疗保健的操作,本质上其实都是医生在收集和处理数据。比如,你的心电图,是图像数据,你的验血报告,是文本数据,你的家族病史,是时间序列数据。2023年以来,随着强大的预训练大模型尤其是开源模型相继问世,医疗大模型也在加速迭代。其中,我国也是重要的参与者,你可以在图中看到扁鹊、本草等大模型。这些大模型,就像是医生版的ChatGPT,不但能和你聊病情,甚至还能根据聊天对象的不同,说出或专业或通俗的话。没那么容易。平时AI机器人聊天,偶尔出现个幻觉,给出个不着调的答案,大都还可以接受,但医疗不行。所以,尽管报告里提到,目前有些医疗方面的AI助手,比如谷歌的Med-PaLM 2 ,在医疗考试中的表现已经基本接近“专家”水平,能达到85%的准确率,但依然只能当个“助手”。《看DAO2024》判断,短期内,生成式AI用于医疗服务,监管阻力最小,确定性最高的应用场景,是扮演医生的“文书助理”。一句“怎么不好?”,一天要问100遍?交给AI,自动帮医生录音,再转录成电子病历。问完还得追问“以前有过这种情况吗?”,又要再问100遍?交给AI,自动帮医生搜索出病人过往病史和检查结果。好不容易看完了,接手的护士一来,还得再说一遍?还是可以交给AI,让AI和护士对齐注意事项,同时叮嘱患者按时服药。不取代某个工作,只带走那项工作中最重复、最无聊、最乏味的部分。《看DAO2024》提到,亚马逊推出了自动生成病历的 HealthScribe,谷歌也在测试类似的生成式AI工具。此外,在我国,百度的灵医大模型,腾讯的医疗大模型也在围绕病历等场景展开。《看DAO2024》提出,2023年年底,全球第一款基因编辑药物在国外获批,基因编辑药物的时代,正式到来。“吃药治病”这件事,也可能会变得和很多人以为的不一样了。以前,药吃进去,会发生什么?刺激你的代谢物、神经递质、激素...让它们摆正心态好好工作,让你恢复健康。以后,药吃进去,可能会跳过身体里这些执行层的“螺丝钉”,直接去找到和搞定最高层:基因。比如,如果一个人贫血,那么这个药一进身体,不进造血部门打招呼搞关系,让它们振作起来,造出更多的血,而是直接冲进董事长办公室翻他电脑,找到负责造血的那段基因,看看是不是基因里的哪段程序代码写错了,导致基因缺陷,命里缺血。如果是,就敲掉那段错误的代码,修改DNA序列,从最源头拨乱反正,让底下的造血团队恢复士气。听起来,简直是逆天改命。这不是上帝才能做的吗?人类能做到吗?以前不能。但2012年,有两位科学家发现,靠一种叫CRISPR的技术,可以帮人类装上“基因的剪刀手”,“上帝的手术刀”,精确找到和剪切任何物种的任何基因。这个发现,让他们获得了2020年的诺贝尔奖,更让几位嗅到机会的科学家,在接下来迅速成立了公司,拉投资,找场景,做应用,满足需求。太厉害了。但是,这种逆天改命的事,要做到,也非常难。因为,人类的基因组,包含了30多亿个碱基对。要针对这些DNA测序分析、甚至精准切割,是一道非常复杂和庞大的计算题。以前需要10年才能完成的DNA测序,让AI来做,一天就能搞定。《看DAO2024》提到,人工智能加速了基因编辑和相关的临床研究。很多以前被视为疑难杂症的,比如心脏病、老年痴呆,都有了新的治疗可能。比亚迪第四季度的交付量,一举超过了特斯拉,成为了全球电动车销冠。太厉害了。对此,特斯拉怎么看?马斯克回复了一句话:“对于很多人来说,特斯拉看起来是一家汽车公司,但它是一家AI/机器人公司。"什么意思?不是在竞争车的销量吗?为什么强调自己是AI公司?虽然,自动驾驶关于自动到什么程度,其实有很多种分级和定义,但大部分人听到这个概念的第一反应,就是百分百的自动:可是,你真的敢放手吗?你凭什么敢放手?人命关天,就这么全部交给一台车子吗?装摄像头,装雷达,装各种传感器。主打一个耳聪目明。然后,让车子通过传感器传回的信号来识别,再通过代码里定好的规则做决策,像最精准的机器一样去开车。该装的也要装,也要耳聪目明,但同时还要有自己的"经验",确保在天气不好,光线欠佳等情况下,车子也能像个"老司机"一样开好。怎么把机器变成人类”老司机"? 用AI的力量,让它好好学习。比如,给它一颗像人类一样有“神经网络”的头脑,给他配备足够多的算力,再给它上足够多的课。《看DAO2024》提到,AI大模型改变了自动驾驶技术路线的竞争格局。它正在教会电动汽车像个五星司机一样开车。比如,马斯克的全自动驾驶技术新版本FSD V12,已经开始用数十亿帧人类驾驶的视频,来教会自己如何驾驶。不再写几十万行的代码来帮机器做决策,而是囤几十万片的芯片来帮机器学习如何做决策。不再通过堆足够多的代码,写足够全的规则来确保安全,而是通过让机器“学习”足够多的数据,涌现足够多的“经验”来确保安全。点开一看,直播的名字叫:《AI大潮下企业如何创新?从技术狂欢到企业落地-私有化大模型是王道》活动里,傅盛聊了两个词:“焦虑”和“机会”。两个词,都是关于大模型。从2023年ChatGPT这个大模型崛起到今天,大模型的“大”,至少有4层。而参数的“大”,又带来了能力的“大”。学习、生成...什么都强,天文、地理...什么都懂。有了它,就像有了一个手握100个博士学位的超级员工。投资了openAI的微软,2023年市值翻身,超过苹果重回全球第一。投身图片大模型的Midjourney,员工40多人,估值飙到100亿美金。但是,面对这种可以颠覆时代的大机会,很多人可能会焦虑,不知道怎么跟上,不知道会不会被抛下。因为,这个大机会,一开始并不是人人都能受益的。大机会的背后,还有大成本。要“培训”出一个有100个博士学位的超级员工,需要投喂大量的数据、投入大量的算力、甚至连电费都动辄上亿美金。想做大模型的生意,不是巨头连入场券都拿不到。想靠大模型做生意的呢?要雇佣这个超级员工,使用它帮自己提效,成本也不会低。那怎么办?大模型的机会,注定只能是少数人的机会吗?不一定。傅盛举了个例子,说2023年,一个千亿参数大模型一年私有化授权费用是几千万。一位客户找到他说,我们就想做一个客服,但这个AI大模型那么牛,我一年投个几千万划不来。但是,今天,你的大模型有千亿参数,是一个手握100个博士学位的全科高手,但我是做地产的,我就想雇个懂地产的博士,行不行?一个专业对口的单科博士,和全科博士比年薪便宜不止一个量级,但kpi完成起来,业绩并不一定差。同样,一个经过专门训练和调试的百亿参数模型,用起来也不一定比一个千亿参数模型差。2024年,把模型“做小”,用少一点的参数和资源,满足一个更精准的需求,也能创造出所有人都受益的价值。这,也是《看DAO2024》里提到的“小”模型的机会。《看DAO2024》写道:2023 年,是大模型之年,而2024 年,将是“小”模型之年。
更多几十亿到上百亿参数的小模型,通过模型 架构、算法、训练和精调的创新,以及结合外部检索,性能可以叫板百亿参数大模型,甚至追平 GPT3.5 (1750 亿参数)。不过,如果你不在这个行业,不关心降本增效,也没关系。穿越、重生、逆袭、复仇...每一分钟都能掐准人心,踩中“爽点”。看短剧上头的人越来越多,靠短剧赚钱的行业也越来越卷。2023年年初,很多人提到AI,想到的还是像ChatGPT那样,用文字聊聊天,搜搜东西,写写文章。后来,Midjourney和文心一言的爆火,又让人发现,AI不但可以处理文字,还可以创作图片。而年末,和短剧一起成为蓝海的,还有AI在视频生成方面的应用。比如,用AI换脸。并且不止用来换掉电视剧里的明星脸,还用在换掉短剧里的亚洲脸。换完直接出海,直接变成一部主角全员“欧洲脸”的,针对海外市场的“新剧”。比如,用AI写剧本。不就是逆袭吗?不就是重生吗?给几个关键词设定,AI编剧可以批量生成,全年无休。再比如,用AI帮助剪辑。文字快剪、智能补帧、智能粗剪......甚至,可以变成动态笔刷,在任意图上一抹,就能让它动起来,变成视频。点开一看,一个20多岁的年轻女孩,从斯坦福退学创业,开了一家叫Pika的公司,半年内吸引了大半个硅谷,融资5500万美元,估值达到2个亿。嗯,年轻有为,真了不起。但往下再刷一屏后,我才发现,重点还在后面。比如,输入一段文字,一个图片...就能自动生成或调整一个视频,并且质感可以比肩电影。Pika 官方展示哎,难怪,有人说,AI的进化,是以天算的。按天迭代,一日千里。《看DAO2024》提出,2024 年将大量出现由生成式 AI 产生的影视剧,冲击影视行业。2023年,很多技术达到了实时生成图像和视频的效果, 这些对影视、音乐、游戏等内容娱乐行业的影响,都是颠覆性的。08
具身智能。空间计算。AI助手。基因编辑。自动驾驶。小模型。AI短剧。如果说,AI时代的竞争,靠的是用“算力”掰手腕,那么像“英伟达H100”这种可用于 AI 加速的 GPU 芯片,就是掰手腕必备的“肌肉”。而“肌肉”储备能挤进这张图里的每一家公司,比如Meta、微软、谷歌、亚马逊、腾讯、阿里巴巴...都有一个共同的别名:科技巨头。什么是科技巨头?只是市值超过万亿美元吗?读完《看DAO2024》,你可能会有一些更具体的体感:你以为它只是有钱,囤下的芯片数量可以超过许多中等国家的举国库存,但其实它还掌控了数据。不但每天有海量的业务数据从自己的业务中产生,还在全球各地斥巨资建立了数据中心。比如,微软每年在数据中心投入的钱,动辄就可以超过500亿美元,相当于一个科技大国在AI基础设施上的投入。你以为资本、芯片和数据就是它的全部优势,但其实这些优势还会衍生出一个新的优势:人才。世界最顶尖的人才。所以,世界上最多高质量AI论文的来源地,不是世界上排名最高的那几所大学,而是谷歌。资本,芯片,数据,人才。层层叠加,相辅相成,共同成就了科技巨头们的算力神话。那还怎么打?难道2024年,乃至整个AI时代的机会,都注定只属于科技巨头吗?初创企业还有没有机会?普通人还有没有机会?这个问题,我也很好奇。在2023年与凯文·凯利对谈时,我曾经请教过他。他的回答是:还有。他说,“我认为AI时代的巨头,不会在已经存在的科技巨头中产生。相反,它现在可能还刚刚起步,少有人知。”哈佛商学院教授克里斯坦森,在那本让他一跃成为“创新之父”的《创新者的窘境》中也曾提出,很多缺资源,也没规模优势的小公司,在面对看似全方位领先的大企业,也都还有胜算。而这些,恰恰也和《看DAO2024》里的一些看法不谋而合,报告提醒:大公司不缺好创意,好资源,但在活力和速度上,却比不上很多小的初创公司。就好比,全球产出最多高质量AI论文的地方,是谷歌。但最先用这些理论做出好模型的,却是OpenAI。AI时代,初创企业还有机会,普通人还有机会,我们还有机会。比尔·盖茨在2023年年末的博客里,写下了这么一句话:“今年是我第一次将 AI 用于工作,而不仅仅是作为一种新奇事物。我怀疑很多人都是如此。我们现在正处于一个巨大的技术转型的开端。”比尔·盖茨如此,我们很多普通人也如此。很多人,也都是在过去的一年里,第一次用到AI,第一次了解AI,甚至第一次听说AI。这,或许也是为什么《看DAO2024》在展望2024年时,居然一改往年风格,选择把所有的篇幅,全部聚焦在了一个主题上:AI。我们不敢说,这里面对AI相关机会的预测,一定能实现。但至少,这些正在发生的,可能改变所有人生活的变化,值得被你早点看到,早点理解,甚至早点为此做些准备。毕竟,机会来时,不会和你打招呼,只会看你有没有做好准备。感谢《看DAO2024》给我们带来的这些有价值的技术趋势,让我们看到技术的变化,也看到正在基于这些变化,不断寻找自己的生态位,为机会的到来做准备的人。