和ChatGPT比,为什么百度即将发布的文心一言,我觉得是个智障?
本文首发微信公众号:飞总聊IT
前两天发的文章“卷死竞争对手!!OpenAI低价倾销ChatGPT”里面提了一下ChatGPT的竞品的情况。
其中我对百度是这样提的:
至于百度,等3月份真的揭开神秘面纱的时候,相信我,和ChatGPT比起来,一定是智能和智障的区别。
努力赚钱的小作者,公众号:飞总聊IT卷死竞争对手!!OpenAI低价倾销ChatGPT!!!
有百度的公关联系我,觉得我对百度的文心一言的理解有偏差,问为什么我就觉得ChatGPT如果有智能的话,百度的产品就是个智障呢?我是不是对百度的认知有偏见,在胡说八道?
坦白说,虽然说我也拿了PhD,但是那是大数据方向的,除了在大数据研究的时候有一篇论文用了一点点AI的东西,基本上我对AI,尤其是深度学习,NLP都是挺无知的。
但是,我这样想肯定也有我的思考和理由。所以我就整理了一下这些理由写出来,大家,包括百度的不是百度的,要是看了以后觉得我说对,欢迎给我点赞转发留言。要是觉得我说的的不对,也可以留言给证据,纠正我。但是我希望大家都能基于理性讨论。
先从这些天一篇有关中国和美国的AI的文章说起,是杜克大学电子和计算机工程系教授陈怡然写的。这篇文章读了很有感触。
他大概的意思是,我们可以把AI想象成一个小孩。欧美的AI走精英路线,出生以后家里一直砸钱到它博士毕业,然后一出场王炸。不管AlphaGo还是ChatGPT,一诞生都是一鸣惊人,诞生之前都是默默烧钱无数。
中国的AI走的是功利教育路线,出生接受的生存教育,养到15岁,家里就开始逼着想办法让它给家里挣钱,学的都是如何市场化的技巧。
陈教授说14年在百度的时候,机器人刚学会基本对话,就开始找盈利场景,于是出现了小度AI以及家电衍生物。18年加入阿里达摩院,对话机器人刚能开口说话,转向阿里小蜜客服机器人。22年加入字节,又是NLP搞机器人客服。
他觉得,在中国这AI就像是一个从村里走出去求学的年轻人,每经过一个路口,就有一群大爷大妈怼着说,哎呦,读博士花那么多钱有啥用,能挣钱不,还不如去厂里打螺丝,三年就盖新房了。
这段结合了陈教授自身经历经验的描述,说明了一个问题,在中国,搞AI,需要快速的盈利,而不是默默的日积月累。公司不可能很多年如一日的投入,不求回报,以期待突然之间横空出世,一鸣惊人。
陈教师的观点,以我个人在中国和美国企业里大数据团队工作的情况来看,我认可。中国企业对盈利的期待和渴望,比美国企业急切,很多时候最好是今天投入,明天就见到钱赚回来。
在这个观点的基础之上,我们来看一看文心一言和相关的东西。百度不是没有搞大模型,百度搞的大模型是什么呢?我能看到的,有个叫做文心大模型的东西。
百度有一个产品--文心一格,是个用AI作画的产品。国外AI作画的产品也有几个了,但是国内百度这算是比较有特色的了。
今年2月初网上爆料了一件事情。有人在文心一格上输入“一只爱国的猫”,让文心一格作画。画出来的猫里有美国国旗的背景。简单来说,爱国被文心一格理解成为爱美国。
我不太喜欢去牵扯非技术性的问题。所以让我们聚焦技术。从技术的角度来说,百度的文心大模型的数据训练集出问题了,用的数据集,训练出来导致了默认爱国等于爱美国。我无法判断文心大模型的原创性,但是请允许我质疑一下它的训练数据集。
百度是怎么修复这个问题的呢?把“爱国”,“爱国的猫”,等等所有你能想象得到的相关词语,都设置成为屏蔽词。让你在源头无法输入这些词,也就无法画出爱国猫等于有美国国旗的猫的画了。
从技术上来讲,看起来,这个大模型本身的语义问题没有修复,或者不容易修复,所以百度只能从用户输入端打补丁,阻止一些可能暴露大语言模型问题的输入。这是从文心一格暴露出来关于文心大模型的技术问题。
这里我们再从另外一个角度看问题,文心大模型到底是一个什么样的大模型?说真的,我也不清楚。
但是文心大模型的第一个应用是画画,那么我是不是可以理解,这个文心大模型里面,画画的训练多一些,聊天的训练少一些。
如果文心大模型已经可以有效对话了,按照杜克大学陈教授的观点,中国家长早就让孩子去赚钱了,我们应该早就见到类似画画的产品出来,给大家聊天了。毕竟中国的AI早熟,要早早的为家里赚钱养家。
既然我们只看到了画画的应用落地,却没有看到聊天的应用落地,所以我们姑且可以判断文心大模型一开始的训练优先级,侧重点是AI画画,不是聊天。
而当ChatGPT横空出世之后,百度的人才发现原来聊天机器人也可以火爆。所以,百度就需要一点时间给文心大模型喂很多语料,来提高其聊天的智能。
这也解释了为什么2月份就开始预热,非要到3月16日才官宣了。因为必须996,007的加班啊,趁着这点时间,赶紧大量的给文心大模型喂语言素材,训练催熟它不擅长的聊天的部分。
我们至少可以判断,在ChatGPT刚火爆的时候,百度的文心大模型并不是以聊天作为其最核心的训练方向的,通过二月份的爱国猫,我们还能判断,文心大模型即使是在画图训练的数据集上,也出现了一些语义的问题。
这样看来,这么急急忙忙的赶出来,3月16日正式登场的文心一言,让我怎么样对它有信心。难道它还能够比ChatGPT更惊艳?催熟做出来的东西,能比厚积薄发,默默烧钱做出来的东西更好?我是很难相信。
但是,百度还是有发布自己的文心一言的理由。陈教授说,中国的互联网公司,都是非常擅长市场化的。当别人都没有大模型的时候,百度好歹还有个可以被催熟的文心大模型。
催熟以后发布产品,大概率也比国内其他企业强。现在先市场化运作,先抢占中国版ChatGPT第一的位置,搞出新闻,搞出估值,肯定不亏。搞市场化,这是中国企业擅长的领域。
但是,本质上,我无法想象,如果百度早就有一个比ChatGPT还牛逼的机器人,百度还能忍着不赚钱不让大家知道,一直默默烧钱,只是为了让它更加优秀。所以呢?当然就是没有嘛。
所以如果ChatGPT的聊天水平叫智能的话,三月十六日登场的文心一言,可不只有一个智障的水平。
微信扫码关注该文公众号作者