Redian新闻
>
和ChatGPT比,为什么百度即将发布的文心一言,我觉得是个智障?

和ChatGPT比,为什么百度即将发布的文心一言,我觉得是个智障?

科技

本文首发微信公众号:飞总聊IT


前两天发的文章“卷死竞争对手!!OpenAI低价倾销ChatGPT”里面提了一下ChatGPT的竞品的情况。


其中我对百度是这样提的:

至于百度,等3月份真的揭开神秘面纱的时候,相信我,和ChatGPT比起来,一定是智能和智障的区别。

努力赚钱的小作者,公众号:飞总聊IT卷死竞争对手!!OpenAI低价倾销ChatGPT!!!


有百度的公关联系我,觉得我对百度的文心一言的理解有偏差,问为什么我就觉得ChatGPT如果有智能的话,百度的产品就是个智障呢?我是不是对百度的认知有偏见,在胡说八道?


坦白说,虽然说我也拿了PhD,但是那是大数据方向的,除了在大数据研究的时候有一篇论文用了一点点AI的东西,基本上我对AI,尤其是深度学习,NLP都是挺无知的。


但是,我这样想肯定也有我的思考和理由。所以我就整理了一下这些理由写出来,大家,包括百度的不是百度的,要是看了以后觉得我说对,欢迎给我点赞转发留言。要是觉得我说的的不对,也可以留言给证据,纠正我。但是我希望大家都能基于理性讨论。


先从这些天一篇有关中国和美国的AI的文章说起,是杜克大学电子和计算机工程系教授陈怡然写的。这篇文章读了很有感触。


他大概的意思是,我们可以把AI想象成一个小孩。欧美的AI走精英路线,出生以后家里一直砸钱到它博士毕业,然后一出场王炸。不管AlphaGo还是ChatGPT,一诞生都是一鸣惊人,诞生之前都是默默烧钱无数。


中国的AI走的是功利教育路线,出生接受的生存教育,养到15岁,家里就开始逼着想办法让它给家里挣钱,学的都是如何市场化的技巧。


陈教授说14年在百度的时候,机器人刚学会基本对话,就开始找盈利场景,于是出现了小度AI以及家电衍生物。18年加入阿里达摩院,对话机器人刚能开口说话,转向阿里小蜜客服机器人。22年加入字节,又是NLP搞机器人客服。


他觉得,在中国这AI就像是一个从村里走出去求学的年轻人,每经过一个路口,就有一群大爷大妈怼着说,哎呦,读博士花那么多钱有啥用,能挣钱不,还不如去厂里打螺丝,三年就盖新房了。


这段结合了陈教授自身经历经验的描述,说明了一个问题,在中国,搞AI,需要快速的盈利,而不是默默的日积月累。公司不可能很多年如一日的投入,不求回报,以期待突然之间横空出世,一鸣惊人。


陈教师的观点,以我个人在中国和美国企业里大数据团队工作的情况来看,我认可。中国企业对盈利的期待和渴望,比美国企业急切,很多时候最好是今天投入,明天就见到钱赚回来。


在这个观点的基础之上,我们来看一看文心一言和相关的东西。百度不是没有搞大模型,百度搞的大模型是什么呢?我能看到的,有个叫做文心大模型的东西。


百度有一个产品--文心一格,是个用AI作画的产品。国外AI作画的产品也有几个了,但是国内百度这算是比较有特色的了。


今年2月初网上爆料了一件事情。有人在文心一格上输入“一只爱国的猫”,让文心一格作画。画出来的猫里有美国国旗的背景。简单来说,爱国被文心一格理解成为爱美国。


我不太喜欢去牵扯非技术性的问题。所以让我们聚焦技术。从技术的角度来说,百度的文心大模型的数据训练集出问题了,用的数据集,训练出来导致了默认爱国等于爱美国。我无法判断文心大模型的原创性,但是请允许我质疑一下它的训练数据集。


百度是怎么修复这个问题的呢?把“爱国”,“爱国的猫”,等等所有你能想象得到的相关词语,都设置成为屏蔽词。让你在源头无法输入这些词,也就无法画出爱国猫等于有美国国旗的猫的画了。


从技术上来讲,看起来,这个大模型本身的语义问题没有修复,或者不容易修复,所以百度只能从用户输入端打补丁,阻止一些可能暴露大语言模型问题的输入。这是从文心一格暴露出来关于文心大模型的技术问题。


这里我们再从另外一个角度看问题,文心大模型到底是一个什么样的大模型?说真的,我也不清楚。


但是文心大模型的第一个应用是画画,那么我是不是可以理解,这个文心大模型里面,画画的训练多一些,聊天的训练少一些。


如果文心大模型已经可以有效对话了,按照杜克大学陈教授的观点,中国家长早就让孩子去赚钱了,我们应该早就见到类似画画的产品出来,给大家聊天了。毕竟中国的AI早熟,要早早为家里赚钱养家。


既然我们只看到了画画的应用落地,却没有看到聊天的应用落地,所以我们姑且可以判断文心大模型一开始的训练优先级,侧重点是AI画画,不是聊天。


而当ChatGPT横空出世之后,百度的人才发现原来聊天机器人也可以火爆。所以,百度就需要一点时间给文心大模型喂很多语料,来提高其聊天的智能。


这也解释了为什么2月份就开始预热,非要到3月16日才官宣了。因为必须996,007的加班啊,趁着这点时间,赶紧大量的给文心大模型喂语言素材,训练催熟它不擅长的聊天的部分。


我们至少可以判断,在ChatGPT刚火爆的时候,百度的文心大模型并不是以聊天作为其最核心的训练方向的,通过二月份的爱国猫,我们还能判断,文心大模型即使是在画图训练的数据集上,也出现了一些语义的问题。


这样看来,这么急急忙忙的赶出来,3月16日正式登场的文心一言,让我怎么样对它有信心。难道它还能够比ChatGPT更惊艳?催熟做出来的东西,能比厚积薄发,默默烧钱做出来的东西更好?我是很难相信。


但是,百度还是有发布自己的文心一言的理由。陈教授说,中国的互联网公司都是非常擅长市场化的。当别人都没有大模型的时候,百度好歹还有个可以被催熟的文心大模型。


催熟以后发布产品,大概率也比国内其他企业强。现在先市场化运作,先抢占中国版ChatGPT第一的位置,搞出新闻,搞出估值,肯定不亏。搞市场化,这是中国企业擅长的领域。


但是,本质上,我无法想象,如果百度早就有一个比ChatGPT还牛逼的机器人,百度还能忍着不赚钱不让大家知道,一直默默烧钱,只是为了让它更加优秀。所以呢?当然就是没有嘛。


所以如果ChatGPT的聊天水平叫智能的话,三月十六日登场的文心一言,可不只有一个智障的水平。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
百度正式发布”文心一言“,它能成为ChatGPT的对手吗?百度文心一言首次亮相!还对标不了ChatGPT,但别急着失望8点1氪:​抖音否认3月1日全国上线外卖服务;百度类ChatGPT项目定名“文心一言”;任天堂将全体员工基本工资统一上调10%百度的“ChatGPT”文心一言还有机会吗?BB鸭 | 首个国产新冠药停产;苹果AR头显售价或超2万;特斯拉推出468元车贴;李彦宏称文心一言和ChatGPT只差一两个月体验完百度的文心一言,我只能说它胆子够大。​少林寺宣布接入百度版 ChatGPT “文心一言”;​中消协点名智能电视套娃式收费;《羊了个羊》营收破亿……百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此闲话人生(226)新年乐往事,感恩三贵人李彦宏的十条思考,解释了为什么百度能最早做出中国ChatGPT亚马逊要求5月重返办公室 3万员工签名反对 ChatGPT“视频升级版”下周公布 将与百度“文心一言”对决Redmi宣布联名哈利波特;马云已回国;百度:文心一言和ChatGPT只差一两月谷歌版ChatGpt犯下低级错误,市值蒸发超7000亿;李彦宏内部定OKR,百度搜索将直接接入文心一言;知乎股价暴涨丨雷峰早报清酒不用烫,浊酒不用筛(8)“本酒”一杯不用戒文心一言,一言难尽苹果iOS 16.4正式推出/马云回国,首谈 ChatGPT/百度发布文心一言升级版百度推出文心一言对标ChatGPT,我们问了它几个问题顶着压力,百度发布文心一言,邀请测试开启早鸟报|抖音回应上线全国外卖服务;百度类ChatGPT项目定名“文心一言”;美团一季度拟招1万人...中国版的 ChatGPT ?百度 文心一言 将开启第一批内测苏月的婚姻路(3)GPT-4老板称害怕ChatGPT/ 李彦宏:文心一言符合预期/ 马斯克欠账不还…今日更多新鲜事在此继ChatGPT、百度文心一言后,阿里也推出相关产品,张勇这样说……最新实测|文心一言 vs ChatGPT,百度想在中文对话击败对手“汉芯第二”的文心一言与“消灭50%工作岗位”的ChatGPT我们拿到了文心一言的首批内测:跟ChatGPT比,谁更聪明?百度这些年到底在干什么?揭秘即将官宣的中国版ChatGPT文心一言背后的故事!换到千般恨百度官宣类ChatGPT大模型新项目:文心一言ChatGPT全球赛开场,李彦宏已无退路,百度文心一言今日正式开始邀请测试!李彦宏的十条思考,解释了为什么百度最早做出中国ChatGPT百度发布的是“文心一言”还是“温馨遗言”?百度将推「文心一言」,打响国内「ChatGPT」第一枪柏林的黄金时代——1920/1930刚刚,百度发布文心一言!对比GPT-4实测!百度顶住压力,背水一战
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。