中国不能输——一场关乎每个中国人的革命,正在激烈进行
全文6800字,主要分为五大部分
(一)人工智能,正开启新科技革命
(二)任何科技,都是一柄双刃利剑
(三)人工智能,重新定义国家主权
(四)扛起使命,国家队正星夜兼程
(五)星火燎原,强强联合实现逆转
(一)人工智能,正开启新科技革命
虽然说副标题用了“星星之火,正在燎原”,但今天咱们聊的不是加拿大的山火,也不是把美丽夏威夷变成人间地狱的岛火,而是一场如火如荼的革命。
伟大教员曾说过,革命不是请客吃饭,不是做文章,不是绘画绣花,不能那样雅致,那样从容不迫,文质彬彬,那样温良恭俭让。
科技革命之所以叫革命,原因就在于科技让生产力极大提升,引起了颠覆性的社会变革,很多新事物不断涌现,很多旧事物也被摧枯拉朽般地消灭。
历史大势是充满激情,也是冷血无情的。当蒸汽机出现了,手工工场自然就倒闭了。火车出现了,马车就被淘汰了。电力机车和内燃机车出现了,蒸汽机车就不见了。
如同现在,新能源汽车行业迎来了春天,但是传统车企却进入了寒冬。人类的悲喜并不相同,关键看谁能顺应时势。新科技革命,总是能引起新一轮的经济、政治大洗牌。
对于一个国家和一个民族来说,谁能在科技革命中拔得头筹,谁就能国际竞争中取得压倒性优势。如果说科技是一柄双刃剑,那就看谁能率先握住剑柄。
英国在第一次工业革命中领跑,于是成了日不落帝国;美国和德国在第二次工业革命占得先机,实现了逆袭;美国引领了第三次科技革命,所以能独霸全球至今。
前文曾提到,截至今天A股收盘,人类至今已经历了十三次科技革命,其中三次在历史上,十次在A股里。人类历史上的三次分别是蒸汽革命、电气革命和信息革命。
而A股里科技革命那就多了,什么超导革命、量子革命、生物革命、电池革命、绿色革命、GPT革命、光芯片革命、新材料革命、核聚变革命……
理想是丰满的,现实是骨感的。虽然说各领域的科技创新方兴未艾、硕果累累,但短时间内能取得颠覆性突破的,引领新科技革命的,人工智能算是比较靠谱的。
从1950年图灵提出“机器可以像人类一样思考”至今,人类已经在人工智能领域深耕了七十多年。虽然前些年,很多时候人工智能更像是人工弱智,但谁还没个童年?
火车童年的时候,被马车嘲笑。但是现在,火车日常运营时速已经高达350公里,且安全快捷、平稳舒适,而马车早已经被扔进了博物馆了。
人工智能也是如此,从深蓝在象棋上战胜人类,到阿法狗在围棋上狂虐人类顶级高手,再到机器人完胜美军王牌飞行员,到如今人工智能已经在通用场景挑战人类。
前两次的科技革命,把人类从机械性、重复性的体力劳动中解放了出来,第三次科技革命,既创造了很多脑力劳动岗位,也创造了很多工具,极大提高了脑力劳动的效率。
为什么说人工智能将引领第四次科技革命呢?因为人工智能,将分担相当一部分脑力劳动,目前已经实现的,有会议速记、机器翻译、身份核验(人脸识别、指纹识别)、新闻播报(语音播报)。
通过机器自动合成文本、语音、图像、视频等已经成为现实,且水平肉眼可见的提高。机器人帮忙写稿子、帮忙做PPT,帮忙写代码,帮忙批改试卷也正成为现实,甚至陪聊服务,心理疏导都成为可能。
总之,用习近平总书记的话说,人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的头雁效应。
(二)任何科技,都是一柄双刃利剑
但需要注意的是,任何科技都是一柄双刃剑,有利也有弊。是利是弊,一是看剑柄在谁手里,二是看挥向什么领域。
据蛋总观察,科技成果一旦有所突破,会以最快的速度被用到三大领域。第一是军事和国家安全领域;第二是金融领域(尤其是股市);第三是传销和诈骗领域。
比如前文所说的,美国已经率先把人工智能用在了军事上。2020年,美军来了一次人机对决,F16的王牌飞行员兼教练,以0:5的悬殊比分输给了机器人,人类没有任何还手机会。
2022年底问世的 ChatGPT聊天机器人,一出生即巅峰,震撼了全球,短短两个月注册用户突破了一个亿,成为人类历史上增长最快的消费者应用。
为什么如此chatGPT如此火爆?原因是它在很多方面,的确震撼了人类。chatGPT不仅上知天文、下知地理,算得了三角函数,解得出高次方程,记得住历史年表,吟得出诗词歌赋,写得出万行代码。
GPT不仅能察言观色,还能卖萌撒娇。面对各种刁钻提问,均能信手拈来、对答如流。可以看出,这款工具已经有了非常惊人的语言理解、生成和推理能力。
人跟它交流,变得非常流畅。它能很好地理解用户的意图,做到多次沟通,完成一轮前后连贯的对话。而且回答清晰、有条理、有逻辑,内容完整,重点清晰。
正是因为ChatGPT具有超强的能力,所以才引发了新一轮全球性的人工智能热潮。但也存在巨大的隐患,就因为它毕竟是个系统。
(三)人工智能,重新定义国家主权
美国为了维护自身的统治,一定不会放弃尝试把ChatGPT武器化。目前看,ChatGPT存在以下涉及国家安全的隐患。这里我们聊一下主权的问题。
随着生产力的发展和人类活动范围的变化,主权的概念也在不断延伸。比如进入大航海时代之后,各国受到了来自海上的威胁,逐渐有了领海的概念,且领海的宽度,跟火炮的射程有关。
最初火炮只能射3海里,所以领海宽度只有3海里。后来到了20世纪五十年代,火炮的射程增添加到了12海里,各国逐渐开始以12海里划界。
领空也是一样。领土受到了来自空中的威胁,于是有了领空的概念。一般认为领空高度是35公里,这是因为飞机和飞艇升限是这么多。
到了信息时代,人类的活动范围延伸到了网络空间,互联网已经渗透到了社会生活的方方面面,网络安全与每个人都息息相关,且极端重要。
一个国家必须对网络空间有绝对的管辖权,因为互联网已经关系到了国家的政治安全、经济安全、军事安全以及社会稳定和文化生活。
而到了人工智能时代,算力安全、算法安全、数据安全,也都关系到国家的前途命运和长治久安。人工智能需要处理大量的数据,对算力要求非常高。
什么是算力呢?就是处理数据的能力,这离不开庞大的服务器,也就是硬件。ChatGPT这种大模型,可以说是包罗万象、有问必答,参数动辄都是上千亿。
这些参数需要用通过大量的数据训练刷题,然后作出更新和调整。没有足够的算力,根本无法快速更新这些参数。这个有多恐怖,我们来举个栗子。
训练GPT-3用到了史上规模最庞大的GPU——英伟达家的TeslaV100,单张卡上拥有超过210亿个晶体管,其深度学习高度相关的Tensor单元,每秒的运算次数高达120万亿次。
但是如果用单卡训练GPT-3模型进行一次训练,需要用288年时间。那怎么办?让一万卡一起算(并行计算),则十多天就训练一次。
从算力上看,我们绝对不能依赖美国的硬件。事实证明,美国已经从算力上卡我们脖子了,禁止高端GPU芯片出口我国。
再说算法安全。再强的算法都是人写的。如果完全依赖国外的大模型,这个算法上有没有漏洞,有没有后门,我们甚至都不用猜测,美国绝对会做手脚。
最后说数据安全。ChatGPT的服务器都在美国,用户输入的信息及生成数字内容时都会使数据流入美国,严重影响我国的数据主权。
通过这些数据,他们可以对用户进行数据画像,来分析生活习惯、健康状况、职业偏好等,进而了解他国的社会、国防和科技动态,影响国家社会安全稳定,甚至可能改变国家治理架构和模式。
ChatGPT具有强大的情报收集能力。ChatGPT超强的学习能力、信息搜集和处理能力、和语义分析和理解能力,很容易就具有判断网络信息的情报价值,然后分门别类,进行搜集汇总。
现在是信息大爆炸的时代,每天都会产生浩如烟海的数据。这个数据有多少呢?2023年全球互联网产生的数据,会超过280EB的数据,1EB约等于一百万TB或者10亿GB。
这么多数据,筛选有用情报,靠人肉CPU显然是不可能的。但是人工智能可以。如果军工领域的敏感人群,或者军迷爱好者使用了GPT,一些不经意间透露的军事情报就被搜集走了。
其实还有一点值得警惕,那就是意识形态安全。退一步说,就算ChatGPT的原始算法在意识形态上不持立场,但是训练所使用的数据,很可能充满了谣言、偏见、歧视和敌视态度。
因此ChatGPT在美国这样的大染缸中长大,不排除美国政府把ChatGPT故意打造成意识形态渗透工具,为中国用户提供错误的、有害的或者是误导性的信息。
因此,人工智能时代,主权的概念也必将进一步延伸,我们姑且称之为人工智能主权,其中包括算力、算法、数据以及内容相关的安全、自主、可控。
(四)扛起使命,国家队正星夜兼程
ChatGPT的火爆出圈,也让中国业界陷入了焦虑,一定程度上暴露了中美在人工智能领域内的巨大差距,而国人对中国的人工智能抱有很高的期望。
长久以来,中国的人工智能被国人寄予厚望,认为这是中国对美国实现弯道超越的绝佳机会,很可能抢在美国之前,开启第四次科技革命的大门。
期望越大,失望就越大。ChatGPT的问世,好像中国输掉了这一回合。所以各种悲观情绪蔓延,网上对中国人工智能企业的冷嘲接踵而至。
首当其冲的,就是人工智能国家队的科大讯飞,因为科大讯飞的AI技术是中国所有人工智能企业中,最能说人话,也最能听懂人话的。
那咋看待ChatGPT的爆火呢?我的理解是,ChatGPT,突然开启了一个亲民路线,以前在专业领域内大显身手的高科技,突然闯入了寻常百姓家,与普通人互动。
以前人工智能技术的落地,更多地体现在垂直领域,比如智慧医疗、智慧教育、智能家居、智慧城市、智慧交通、智能制造等场景中,其实中国才是AI应用第一大国。
ChatGPT的意义在于,突然自创了一个新赛道。就好比重竞技比赛,此前有拳击,有散打,有柔道,有柔术,有摔跤,现在ChatGPT弄了个终极无限制格斗冠军赛。
也好比田径赛,本来有短跑,中长跑,长跑,跨栏,竞走,马拉松,各有各的规则,现在ChatGPT弄了个铁人三项,或山地越野超级马拉松,而且自己率先出发了。
本来中国企业都有自己的赛道布局,但chatGPT这么一来,还是有点慌的。作为一个企业,面对严酷而瞬息万变的国际竞争,必须要重新调整布局,重新调配资源。这个赛道,承载了国人的期待,事关民心士气。
但是调整也不是那么容易的,参赛方案怎么策划,技术路线怎么确定,人才哪儿来(需要从各个部门抽调,甚至要临时招聘),资金怎么安排。
这跟跑步也是一样的,就算是马拉松冠军,临时调整到山地越野超级马拉松,那也得经过很长的调整和训练, 而且参赛的时候,得有详细的计划,如何分配体力,如何应对不同情况,如何控制塞道节点。
ChatGPT出来之后, 讯飞经过了研判, 很快就果断下决心切入这个赛道。15天后,科大讯飞启动了 “1+N”认知智能大模型的专项攻关。
这个就是星火大模型项目。我个人非常喜欢这个名字,因为在中国革命最困难的时候,伟大教员用“星星之火,可以燎原”来鼓舞大家。
科大讯飞最初的创业口号也受到了伟大教员的鼓舞:燃烧最亮的火把,要么率先燎原,要么最先熄灭。创业之初的口号,如今依然适用,也表现了讯飞的星火大模型的信心和决心。
“1+N”的“1”,就是通用大模型,N就是多个落地领域,包括教育、办公、汽车、医疗、工业等多个行业场景等。
这个咋理解呢?我认为还是讯飞的科大烙印太深了,讯飞培养机器人的思路,跟科大培养本科生的思路简直是一样一样的。
在中科大,大一大二的教学是不分专业的,哪个系都是学高数、物理、英语,思政,计算机等。最变态的,以前有个系叫英语系,也得学数学、物理、计算机,教材跟其他系也是一样的。
正是因为大一大二有了扎实的基础(尤其是数理基础)之后,大三可以自由选择专业,然后学院专业课、系专业课,毕业后就可以到对口公司工作了。
讯飞也是这样,通用大模型作为一个技术基底,然后开始上专业课(专业开发),还要经过对口实习(领域内数据的训练),然后就可以胜任细分领域的工作。
当然,毕业生到了企业,企业也会有对应的培训,这时候企业可能会有保密要求了。讯飞星火也是如此,可以面向行业用户进行私有化定制,建立私有云。
讯飞的目标也跟科大一样,科大的毕业生由于有坚实的数理基础,所以就业面很广,讯飞星火也一样,也是要面对各行各业,甚至千家万户,成为企业的员工,家庭的保姆,或者个人的助理。
如果说去年12月15日讯飞星火立项,那只是刚有了本科生的教学计划,并且还是第一届的。不过讯飞是志在必得的,且给自己立下了flag。
第一个时间节点是5月6日,星火1.0版本;第二个时间节点是6月9日,星火V1.5版本;第三个时间节点是8月15日,星火V2.0;第四个时间节点是10月24日。
讯飞作为“会说人话”的人工智能马拉松冠军,转换铁三或山地越野超级马拉松,虽然有困难,但相对而言也是有基础的。
从此之后,讯飞开始了星夜兼程、一路狂飙。目前来看,前三个节点把控都是很精准的。侧面也反映出,讯飞还是有技术功底和技术储备的。
虽然说讯飞如期而至,似乎留了很多余地,实则不然,就在星火V2.0发布前几个小时,团队还在疯狂调试,像极了考试结束铃声已响起还在忙活作文的我。
(五)星火燎原,强强联合实现逆转
这个讯飞星火2.0怎样呢?我认为最重大的意义,那就是功能强大且安全可控。对于认知大模型来说,自己写的代码算是先天基因,那么数据训练就相当于后天的教育。
无论先天还是后天,讯飞星火都是安全的。代码是自己写的,训练所用的数据,也都是安全可靠的,得到了国家的监督和支持,在价值导向上不会出现偏差。
刚才说了,科大讯飞是“最会说人话、也最听得懂人话”的人工智能企业了。举个最简单的数据,讯飞翻译机,已经支持80多种语言了,就中文来说也支持21种方言。
能支持这么多,是因为讯飞已经掌握了人类语言的规律,已经有比较成熟的语言处理模型,只要采集足够多的语言数据,让相关模型进行题海战术,很快就掌握了一门语言。
从语言的角度,讯飞星火不仅可以充分理解用户意图,跟用户对答如流,还可以在中英文之间自由切换。请回去之后,既可以当伴读书童,还可以当雅思考官,也可以当企业面试官。
更令人称奇的是讯飞星火,不仅“最会说人话、也最听得懂人话,也会办人事儿了,甚至办人办不了的人事儿”。包括新闻报道、故事创作、品宣文案等等。
《麻省理工科技评论》有一套针对人工智能的综合测评系统,目标就是寻求最聪明的大模型。在最新的国产大模型评测中,讯飞星火正如大家所料问鼎第一。
昨天我看了星火V2.0的发布会,震撼点太多了。其中有一项,是“星火+教育”的,可以自动生成教学方案,也可以自动生成PPT,还能为老师精选备课材料,甚至现场生成插图。
星火V2.0不仅仅是个巨型图书馆、上通天文下通地理的语言大师,还是个理工科学霸,昨天儿子正刷暑假作业,我试了一道证明题,立马给出了解题过程。
我很震惊,又拿出了吉米多维奇,随手来了一道,也很快给出了证明。不过也有她不会的,我让她证明哥德巴赫猜想,这下她傻眼了。
除了会算题,还会写代码,而且可以在各种编程语言之间瞬间切换,且代码非常规范标准,外行看上去都赏心悦目。
可以看出,从算法上星火V2.0还是很强悍的。在发布会上,刘庆峰向大家保证,星火的算法都是讯飞人一行一行敲出来的,而不是利用公开的源代码改造的。
这个我相信,因为在星火之前,讯飞已经在语言领域、教育领域、医疗领域深耕多年,已经有了自己独特的理解和雄厚的技术储备。
自己写的代码,就不怕有人故意留有后门。从这一点上,确保了算法的安全、自主、可靠。从星火诞生和成长的速度,以及运行的敏捷程度来看,星火的算力也惊人。
这是为什么呢?这是因为星火的另一个过人之处,那就是通过强强联合,确保了算力安全。讯飞星火2.0和所有的产品的架构,都在安全可控的平台上,因为这个平台是由讯飞和华为一起开发的。
华为昇腾AI集群的单卡算力已经可以对标英伟达A100。而集群的规模已经逐步扩大,从最初的四千卡到一万卡,再到16000卡,成为业界首个万卡AI集群。
实话实说,一万卡还是雄伟壮观的。这就是讯飞星火的底座支撑,既安全可靠,又算力澎湃,还不怕被卡脖子。
也基于这样的强强联合,讯飞和华为联手推出了星火一体机,可用于问答系统、对话生成、知识图谱构建、智能推荐等领域的应用,学习能力很强,适应和融入能力也很强。
星火一体机能干什么呢?可用于问答系统、对话生成、知识图谱构建、智能推荐等,胜任的岗位包括办公、代码、客服、运维、营销、采购等等。
这款星火一体机,可以让所有企业用户都插上人工智能的翅膀,大大降低了人工智能落地的门槛,企业拿回去就能用,功能强劲且安全、自主、可靠,企业数据不会外传。
讯飞星火肯定还有不足之处,但要知道她5月6日才呱呱坠地,到现在刚好才满100天。而这100天,可以看到星火惊人的成长,这惊人的成长是因为厚积薄发,更是因为星夜兼程。
为什么要星夜兼程?因为第四次工业革命来了,这一仗我们不能输。发布会上,刘庆峰讲了个小细节,让人很感动。
发布会前一天,他去看望星火的推理团队、文图生成团队、保障团队、内容安全团队以及星火APP小助手和讯飞智作等团队,发现大家精神抖擞,欢声笑语。
要知道这些团队已经鏖战多日了,竟然还能如此斗志昂扬。为什么呢?因为大家憋了一股劲儿,必须永争第一,也一定能争得第一。
刘庆峰还发现,第三排站了一排陌生面孔,他一问原来是华为的兄弟们。他让华为的团队回去休息,华为的团队说讯飞人不走我们也不走。
从这个情景可以看出,扣响第四次科技革命大门的赛道上,讯飞不孤单,讯飞的旁边有华为。而讯飞和华为的身后是14亿中国人。
星星之火,可以燎原。星星之火,正在燎原。
微信扫码关注该文公众号作者