到了我的地盘,就算你GPT驾临,也让你不懂中文。
1
ChatGPT的浪潮,已经席卷而来。
纵使有道无形的墙,让我们无法在第一时间一窥庐山的真面目,但是,正如之前的虚拟币、元宇宙、无人驾驶、共享打车的风口吹进国内时一样,ChatGPT的风,也唤醒了国内互联网公司追逐人工智能的心。
就如同他们追逐医药广告、社交、外卖、团购、O2O时一样,初心不改。
3月16日,曾经是国内三巨头之一、如今已经落寞许久的某家公司,当家老板一袭白衣下系着白色皮带,如沐春风地站在聚光灯下,身后硕大的投屏和加粗的字体,也掩盖不了口吐芬芳的他所散发出来的魄力。
之所以说他散发出来的是“魄力”,而不是“魅力”,是因为他自己的声音,也显得中气不足,话语转折之间少了杀伐决断的决心,多的是虚拟语气和谦虚的连词。
虽然老板和首席技术官,在吹嘘的间隙,也会有谦虚的语态,但是反复摆出一副情非得已的姿态:如果不是行业合作伙伴在催促我们的话本来不想这么快推出,依然透露出骨子里的自命不凡。
根据该司官方说法:精心挑选的5个问题,显示了「文心一言」在在文学创作、商业文案创作、数理推算、中文理解、多模态生成5个使用场景中的综合能力。
这基本涵盖了当前最先进的ChatGPT的打击范围,并且暗戳戳地传达话外之音,「文心一言」在中文的地盘,是不容ChatGPT染指的。
正如同当年,在中文搜索引擎领域,不让Google染指。
毕竟,这里的互联网用户,最大的需求就是获取中文世界里的信息,他们不会对英文世界感兴趣,也没有能力和胆量去感兴趣。
至于非要把语言当做搜索引擎的看家本领,而不是技术、价值观,谁又会深究呢?
大家都很忙的,对吧?
如果不是看到他播放的是提前录制好的测试视频,明哥差点就相信了,这个在GPT-3.5模型横空出世后宣布自己也摩拳擦掌了3年的文心一言,一出世就是巅峰。
明哥当年可是在Top 2高校里,涉猎过自然语言处理的研究,无论是对文本的情感分析、摘要抽取、语言翻译,还是对连续对话的上下文联系,颇有三脚猫的功夫。
所以,无论吹得如何天花乱坠,明哥不会这么轻易相信,中国版本的ChatGPT,就如同孙悟空一样,霹雳一声响,就从石头缝里蹦出来了。
本来我想动手的,发现连邀请码都没有。
互联网业边缘人的地位是坐实了。
幸运的是,不甘寂寞、不给人面子的网友们,脑洞大开,把「文心一言」玩出了花。
也就免得明哥动手了。
2
如果不是看到了提问画画的具体需求,只是让我们品味下画作,我们不但会觉得天马行空、非常具有后现代主义的想象力,还会觉得画作的基本功浑然天成,毫无做作痕迹。
可一旦让你看下提问者的具体需求文字,你绝对会哑然失笑。
它只懂用人工智能来画画,却绝对不懂语言,更加不懂中文。
对文字的理解,分为三个层次。
第一层次,认得每一个单一的汉字,毫无联想功能和文化底蕴;
第二层次,可以做语法分析并且定位关键词意,通过搜索进行匹配外部类似内容;
第三层次,完全理解文字含义,不仅是字面含义,更是背后蕴含的丰富知识和推理逻辑。
计算机刚诞生时,用每一个ASCII码,来定位唯一的字母,在它的眼里,字母和汉字,没有意义、情感、所指,只是一串毫无意义的字符;
自从搜索引擎诞生后,虽然依然不懂字词句的含义,但是通过语法分析和疾速无穷的搜索匹配能力,它能在海量的互联网世界里,把类似的内容网页给钩出来。
如果说,第一层次是人类婴儿时期的水平,第二层次是小学生的水平,那么第三层次几乎就是知名大学本科毕业生,甚至是研究生的水平了。
很明显,文心一言,完全不懂中文,尤其是带有历史典故的成语、歇后语、俚语,它甚至不愿意打通百度的搜索引擎,去理解这些特定的文化语言背后的故事,或者去搜索曾经用这些词语描述的相似图片。
它能做的,就是把一个个汉字拆开,然后单独局部作画,最后把不同局部的画区域,渲染、过渡到一起。
“青梅竹马的情侣”,不就是青色背景上出现了梅花、珠子、骏马和情人吗?
“桃李满天下的王老师”,不就是以“天”为背景,出现一个孔子化身的老师,有桃子、有李子点缀在头上吗?
婴儿要这么理解,也没毛病。
可问题在于,哪怕是婴儿,无法深入理解复杂的语言,但是在和父母对话时,能够有上下文联想和持续对话能力。
文心一言,仿佛表现得像喝醉酒一样,容易断片,下文不接上文,和鱼的记忆力只有7秒瞬间就忘。
所以,明哥能够初步判断出来,文心一言的底层模型并不复杂,和ChatGPT也是两个完全不同的物种。
当且仅当以下3个条件同时满足时,它才可以正常工作,否则随时变成一个记忆力不超过7秒钟的婴儿:
第一,提问者只提1个问题;
第二,问题是中文的文字形式的;
第三,在中文互联网上有非常接近的问题,并且给出了答案。
说白了,这还不是搜索引擎吗?
当前阶段的文心一言,从本质上而言,不像有自发学习、推理能力的大语言模型,更像是一个换了个外壳的搜索引擎。
3
遥想几个月前的ChatGPT,基于GPT-3.5模型,虽然也存在知识答错的情况,但是足够震撼人心的理由是,它表现出了足够的上下文联想能力、逻辑推理和新知识涌现能力,之所以有些时候答非所问,无非是学习的语料还不够丰富、学习的时间还不够长导致的。
几个月前,尽管它暴露出了这些问题,我们依然能够相信,很快,功能更加强大、全方面取代人类文字工作的GPT-4.0,已经在路上了。
然而,今天的文心一言,虽然外壳很像大语言模型,在回答单一的中文问题时尽量表现得像个阅历丰富的字典,但是一想到它的基础能力如此欠缺,更像是一个传统的中文搜索引擎,就真的乐观不起来。
在发布会的现场,我们除了要接受那些专业词汇的地毯式轰炸,还能感受到,这哪里是技术部门主导的发布会,更像是市场、销售部门,赶着老板上架,对接的那些所谓行业开发伙伴,无一不透露着尽快接入,以便节省成本、提高KPI的功利之心。
那些话术,不是说给技术人员、产品经理听的,更像是背诵销售部门提前为T o B端的企业客户准备好的推广话术。
虽然明哥有点失望,但是尽量客观地说,我们将不得不承认,它还是会“成功”的,就和当年中文搜索引擎的“成功”路径一样。
它有可能一统国内中文的类GPT产品的市场,占据最起码七成的市场份额。
毕竟,无论模仿类GPT产品做得怎么样,就算再烂,只要其他人也做不起来,最后大家不还得捏着鼻子用原来的搜索引擎吗?
在这片大市场里:
以前,它从来不把Google搜索作为自己的竞争对手;
未来,它也不会将ChatGPT作为自己扩张的拦路虎。
因为,双方根本不在一个战场上。
压根不给对手以同场竞技的机会。
怎么输?
写在最后:
从基层农村出发,在清华大学完成研究生教育后,明哥走过13年深入商业风云、直面资本运作、驾驭浮沉股海的历程。
房价变迁、P2P网贷、瑞幸咖啡造假、长租公寓爆雷、中国银行「原油宝」、蚂蚁集团IPO、恒大爆雷……地产巨头刀尖起舞、互联网寡头纵横捭阖、资本人物掀起权谋大戏,在明哥笔下,纤毫毕现,无所遁形。
埋头赶路的上班族、披荆斩棘的创业者、商海沉浮的企业主,还是股海中杀伐决断的股民,云集而来,抱团前行。
作为领路人,我们为2500+个读者解答了人生命题,重塑了底层逻辑,在职场、资本市场、房市中助力弯道超车,改变了一批年轻家庭的财富轨迹。
明哥邀请你加入私密知识圈子:知识星球。 7大篇章:商业真相、投资入门、稳健投资、房价解析、下一代成长、人生规划、思维重构,共1000+精华文章等你垂阅,随时和明哥一对一问答。 长按上面的绿色图片,识别图中的二维码,付费加入。老用户续费自动8折。 下载知识星球App,用微信登录,使用更顺滑。
辛辣、深度的文字,见证波云诡谲的时代。
没关注?请点击,关注公众号:
微信扫码关注该文公众号作者