试用ChatGPT展望AI世界
听说最近开发的AI聊天利器ChatGPT非常聪明,我就下载了一个β版试试,果然神奇。
先是输入一个知识点,“日俄战争”,回答很长,很全面,有1904和1945 两场战争的详细描述。但感觉和Google没什么差别,都是叙述性的,这不需要什么智力,只要从数据库抽取就可以。
然后输入一个需要分析的过往事件,“习近平如何操弄权力”。其回答还比较专业,比西方的观点正面,比中国官方观点客观,认为习近平通过打击反腐,成功扭转经济危机(好像是有这事),成功控制疫情,纠正贫富差距,分化对手等。这让我对其刮目相看,有点水平,也还算客观。
接着输入一个前瞻性事件,“习近平如何控制当前疫情”。软件回答道,这个程序没有受过对前瞻性问题预测的功能,无法作出准确预测,但根据以往经验,习近平会参考专家意见,政治经济形势和国内外经验,作出一个合适的处理。基于习近平成功的执政经验,相信他能采取合理的决策。厌习的人肯定不爱听,但这说明在软件的基本算法中,还是相当客观的,不戴有色眼镜看问题。至少比一些SB强太多。
我又问了一个我的工作中相当专业的问题,其回答还对头,甚至给了我一个新的思路。儿子说,有人用这个软件试验USMLE考试(美国医生资格考试),能够及格!
AI里程碑的事件是围棋软件AlphaGo, 打败了人类智慧的明珠围棋,让围棋大师成了笑话,现在的围棋比赛成了有上帝视角的游戏,借助AI,讲棋的观棋者都知道结局,就看那些撒逼棋手怎么走了,成了聪明人看斗兽的游戏。最近的AlphaFold, 让颜宁这位蛋白质结构科学家丢了饭碗,只能回国当政治科学家了。
Computer 技术在中文里的名称有变迁,从计算机,电脑,到IT/AI(直接用英文的多), 其实也代表了computer 技术侧重点的变迁。早期主要是计算功能,是名副其实的计算机,处理的东西必须有明确的计算公式。以后,可以按照指令,运行一些复杂的程序,功能也不仅限于计算,可以控制动作,可以处理视频图像,可以根据不同的情形作出判断和决策。这时再叫计算机就有点小看它了,所以叫电脑,确实具有人脑的某些功能了。那些指令需要遵循某种思路,叫做算法,包括计算公式,但不仅限于公式。
但电脑再能干,却也只是个傀儡,只能按人输入的指令行动。而人脑是具有主动性,学习性,创造性等特点的,因此有专家认定,电脑永远也赶不上人脑。是吗?有人不信邪,开始了用电脑和人脑进行智力竞赛。在1997年,一个叫深蓝的电脑打败了人类的国际象棋冠军。在这项被称为人类智力皇冠的项目上,人类以后再无胜机。国际象棋不是一种机械的活动,对手的每一步都是不可预测的,需要随机应变。人类棋手很多时候是基于直觉和经验下棋的,但如果完全通过计算,也是可能的。因为有可行的算法,加上足够强大的计算容量和速度,使得电脑可以战胜人脑。这以后,对于那些有确定的算法,输入的是确定的数据的工作,如气象预测,股市预测,最优化筛选等,不管计算多么繁复,电脑都能胜任并超过人脑了。
但在有确定数据输入的工作中,有两种情况不好对付,一种是无可靠算法,第二种是计算过于庞大超出了现有设备的能力。典型的例子就是围棋,虽然输入有确定的坐标,也有简单的规则,但判断形势无可靠的参数,如按国际象棋的算法去做,计算量超出了现有最强大电脑的容量。
Google的Alpha-Go项目组,开发出一种新的算法:学习。我的理解,学习算法就是不管要做的事有没有规律,只要跟着人做几遍,照样画葫芦,总结出人的步骤,形成程序,依样行事。这听上去不错,也和人类的行事方法相似。人类大多数事都是学会的,就是像性交这样的本能,一蹴而就的人不多,好男儿都是百炼成钢的,这就是为什么很多少女爱大叔的原因。
而且Google开发的算法是通用的,并不仅限于围棋,还发表在公开的科学杂志上,当然具体怎么运用就是各家自己的本事了,那属于专利了。就Alpha-Go的学习算法而言,是通过大量的练习,对每一步都优选了7-10种走法,练习得越多,优选的对策越好。虽然总计算量依然很大,但比国际象棋那种算法要好多了,现有电脑能力可以应付。Alpha-Go的成绩也很好,先是打败了欧洲冠军,然后挑战称霸世界围棋棋坛十余年的李世石,4:1, 李还赢了一盘,过了一年又挑战现霸主柯洁,5:0,柯洁根本没有机会。以后又出了第二代,在围棋网上摆擂台,人类选手根本不可望其项背。
这种学习算法在AI历史上是划时代的,从此AI的发展出现井喷现象,在很多没有规律,高度依赖经验的领域出现突破。其中中国的进展神速,原因之一是这种算法高度依赖于练习量,中国人多,又没很多限制私人信息使用的法律,因此就构成了优势。
但在输入信息不稳定的领域,AI遇到的挑战很大,特别是在预期市场巨大的无人驾驶和人工翻译领域。用过单反相机(通过眼睛摄取)的人都知道,人眼比手机和无反的显示屏摄取速度快,分辨率高,在背景反差很大的地方,如背光时,显示屏上人脸全黑了,而人眼分辨起来一点问题没有。这还要从数据处理方法的不同说起。用过老式手机的人都听说过模拟制式,这是模拟信号的波形的一种数据处理方法。现代手机都是数字式,就是把信号转化为不同的开关堆砌。电脑也是用的数字方式,但人脑除了有数字式的动作电位,还有模拟式的连续电位,表现为易感性变化的潜在电位等,获取和解析信号的水平是电子眼无法企及的。因此,人眼不但比电子眼敏感,而且容受性高,对物体分辨率,解析率高。
语言的难度不在于书面,和一般性的听说,而在于面对面交流。在面对面交流中,信息的80%通过肢体语言。这里又回到视觉上了,要通过眼睛读懂对方表情,肢体的变化的含义,这是目前电子眼难以做到的。这方面的突破,要等待电子读取和解析技术的发展,学习算法可能有点帮助,但突破不太可能。
AlphaGo 和AlphaFold,虽然神奇,但毕竟学习机会很多,有无数棋谱和蛋白质结构与氨基酸程序的实例,经过学习,能够成为一个顶级专家,这还可以理解。但ChatGPT的功能则太强大了,涉及任何领域,也有理解语言的难度,虽然不用考虑肢体语言,但输入信息是不稳定的。看来,AI又有了重大突破,其强大程度,恐怕是已经超越了AlphoGO的思路了。
一圈下来,我的结论是:对于输入信息确定的领域,无论是有规律的还是高度依靠经验的,AI将很快取代人类,这里包括一些高级职位,如投资经理,放射科病理科医生,法官,律师,甚至牛逼哄哄的伟大领袖。输入信息不稳定的领域,则已经取得了重大突破。
另外,现在AI的未来还是掌握在人手里,人可以克制自己不去发展某个方面。如创造性,如果电脑会创造,那它就可能是主人了。当然,像中国政府那样,想着AI 为其所用,发展起来去控制人民,那也是很无奈的事。人类已经犯了一个错误,创造了最后成为自己主子的独裁政府,那就不要再犯错误,去创造可能成为自己主人的电脑了!