Redian新闻
>
ChatGPT吹牛逼大赛,谁能胜出?

ChatGPT吹牛逼大赛,谁能胜出?

科技

去年12月,咱们已经聊过一回ChatGPT(《爆火的ChatGPT,先颠覆谁?》)。过了俩月,这东西更是红的发紫了。而且,在中国的泛IT圈,它掀起了一场前无古人的吹牛逼大赛!不信,您瞧瞧下面这些新闻:

昆仑万维:今年内发布中国版类ChatGPT代码开源

360:计划推出类ChatGPT技术的demo版产品

少林寺:与百度合作,接入类ChatGPT智能对话产品

寺库:将对ChatGPT相关技术深入研究和拓展

水滴:公司内部已经开展类ChatGPT应用测试

百度:将于3月推出类似ChatGPT的聊天机器人

阿里:正研发类ChatGPT产品,目前正内测

华为:在类似 ChatGPT 方向的布局

讯飞:类ChatGPT技术将于5月落地

王慧文:带资5000万刀打造中国版ChatGPT

北京市:支持头部企业打造对标ChatGPT的大模型


咱们再看看所谓“ChatGPT概念股”里,某天股价长势最喜人的几家,赵丽蓉讲话:我瞅这些咋就不像唱评戏的呢?


当然,这里面肯定有认真消化和研究技术的实践者,不过在吹牛逼大赛的氛围下,除非产品问世,否则也就难辨雌雄了。


而对其中的吹牛选手来说,除非有一天虾酱也成了海鲜,他们与ChatGPT的距离,才会跟牛郎星和织女星的距离差不多。


我并不是大赛种子选手,当然也不是骂街来的。想知道吹牛逼大赛的结果,您得了解这项新技术的一些底层逻辑:它的初心是解决什么问题?它与之前的技术有什么进展?复现它的难度和门槛在哪里?理解了这些,到底谁是真冠军,谁是吹牛逼,您可以自行判断。


纯粹讲技术的干货,很多大佬写过,只是多数读者未必看得懂。所以,我想完全用浅显的例子和比方,帮大家粗浅地理解一下它的原理和背景。不过请谨记,这些并不是严肃讨论,只当是扩充一下茶余饭后的谈资吧!


大语言模型是弄啥的

ChatGPT这东西,是大语言模型(Large Language Model, LLM)的一种。有多大呢?大约1750亿个参数。您想想,一个参数就算4个字节,1750亿个......反正不老少的了!


没错,不光是ChatGPT,从18年谷歌的Bert开始,当今的语言模型研究界就有个无奈的共识:大,才是真的好!这虽然是经过实践效果检验过的技术路线,但是具体到语言的建模,还是有一些根本原因。


长时间以来,人类对自己的语言本质到底是什么,一直是搞不大清的。一度大家认为,语言就是“语法结构 + 词汇”:词之间的关系框架确定了,再把词意套进去,就能明白一句话说的是啥了。所以在我刚进入AI领域的那个年代,对句子结构的自动分析,和对词义的建模,都是自然语言处理的重要任务。


可是实际上,这个认识是有根本缺陷的!为什么这么说?您看看下面这一对句子:

爸爸抱不动儿子了,因为太胖了 

爸爸抱不动儿子了,因为太瘦了


稍微琢磨一下就能发现:第一句里的“他”,指代的是“儿子”;而第二句里的“他”,指代的是“爸爸”。这两句话的结构一模一样,只有一个字做了反义替换,为什么连指代关系都变了呢?很显然,仅仅靠这两句话本身的信息,是没法解释这样的理解过程的。也就是说,人类在理解语言的过程中,一定有一个庞大的常识和背景知识网络,在背后默默做着支撑!


打个比方,要理解一句话的意思,字面上的信息只是冰山露出来的那一小块,而水面下还有庞大的一坨常识和背景知识,那才是理解的关键。细想想这也很好理解:一个人要善解人意,那总得见多识广,通晓世情,机器又何尝不是如此呢?


既然如此,何不干脆就把人类能收集到的各种语料,从教授讲课到泼妇骂街,从医学杂志到黄色网文,一古脑儿地塞到一个巨大的模型里,看看他能学出啥来,如果真学得有点模样,再去理解人类语言,是不是能有所突破?


一般人即使敢想也不会干,会干也玩不起,因为这个模型的规模实在是太太太大了!可是,谷歌有钱又敢干,他们在18年出了个Bert大模型,庸俗化地说,就是上面的思路,这个模型一出,在学术界就引起了轰动,虽然说当时离今天我们看到的ChatGPT还有不少差距,但是在一些学术性指标上,把自然语言理解这个多年徘徊不前的任务,往前推进了一大步。


就这样,又一次在“大力出奇迹”的思路下,我们似乎看到了理解语言的一线曙光。


ChatGPT的独门武功

虽然ChatGPT也属于大语言模型的范畴,但是,它可能是第一个人类愿意坐下来跟它盘道的聊天机器人,产业里程碑的意义和影响力显然已经高于Bert这个前辈。


那么,ChatGPT有什么独门武功呢?是不是就因为模型更大,数据更多,才力压Bert的呢?不能这么说,虽然它们底层的一些技术如Transformer等一致,但是OpenAI在问题的定义上,一开始就选择了一条更根本、也更困难的道路。


与自然语言相关的任务有很多,比如翻译、客服、甚至是编程、写诗。我们好不容易搞了个大模型,怎么用在这些五花八门的任务上呢?


按照谷歌的设想,大模型只做通用背景知识的学习建模,目标也简单:从一个句子里扣掉几个词,让大模型做完形填空,看它是不是能填准。如果要解决某个具体领域的任务,那么就利用领域数据,把通用大模型捏咕捏咕,打造一个领域模型来用。


在这个路线下,如果有个初中数学答疑的领域AI,即使你问他什么数学问题它都对答如流,但是一旦跳出来问一句“今晚上你觉得我应该吃点啥?”,他会立刻不知所云,愤而死机。


那么,OpenAI是如何定义问题的呢?他们认为,不应该一个领域搞一个模型,而是应该根据聊天过程中用户的提示,也就是“Prompt”,随时灵活地切换任务模式!如果这个能实现,上面例子里从数学课里跳出来讨论晚饭的场景,你就不会觉得对面的数学特级教师瞬间变成二傻子了。


也就是说,谷歌的思路,是给你准备一个排的专业秘书,但是每人只会一样;而OpenAI的思路,是给你搞一个全能秘书,白天有事都是这秘书干!当然,晚上人家就不管了。


显然,后面这个难得多了!所以,OpenAI以前发布的模型,都没能达到比谷歌更惊艳的体验。然而这次,它显然是跨越了这个体验门槛!


其实仔细分析一下,就信息质量而言,ChatGPT胡说八道的地方还多了去了。但是,让大家感到惊艳的,是这家伙你问什么都接得住:翻译、编程、写作文,先不论结果如何,人家没有二傻子一样的盲区!而这就是OpenAI的问题定义长期努力的结果。


当然,除了这个更远大的目标,ChatGPT在学习技术上,也有一些效果很好的突破,其中最关键的是RLHF(Reinforcement Learning from Human Feedback),“依据人类反馈的强化学习”。


这是句黑话,大家不用理它。实际上,它就是在大语言模型的学习过程中,加入了“模拟考试”的环节。


原来的大模型,就像是”题海战术“:把所有收集到的语料往里一堆,你自个儿练去吧!当然,见得多了,就算是没有老师点拨,这家伙的应试能力肯定也会提高。而这次的ChatGPT,加入了这么一个环节:你练完了,我找个老师跟你聊,看你哪句答得不像话,就给个小叉叉,这不就是模拟考试嘛!拿着这带小叉叉的试卷回去再题海战术,这么一轮一轮来,成绩提高得可就快了!


咱们这儿说说简单,上面这一大堆被我庸俗化了的思路,要变成具体的计算公式和解决方案,那可真不是件容易的事儿!绝不是只要有钱、敢吹就能搞定的。


中文ChatGPT难度何在

说回中国IT圈的吹牛逼大赛。除了嘴皮子功夫,要在中国搞出ChatGPT水准的技术和产品,有哪些核心的门槛和难度呢?


依我看,这里有两个硬条件、一个软条件。


第一个硬条件,当然是把技术基本吃透。


这事儿,能实践参与的就不多:学术界因为算力和数据规模限制,靠自己的力量基本无法复现这些研究,最多也就是推推公式;产业界因为巨大的投入可能累及企业利润,能够大规模投入的也是凤毛麟角。


不过,我觉得这一点还只是时间问题:资本市场热成这样,牛逼也都吹了一通,成本上的顾虑已经不重要了。正如Yann Lecun说的,ChatGPT其实也并非在底层技术上有巨大突破,这话虽然有点酸葡萄,倒也还算比较公允。所以假以时日,几家大厂至少消化现有的ChatGPT技术,然后堆算力搞个中文版出来,我还是比较乐观的。


第二个硬条件,是数据的质和量。


说到这个,我们就不得不有点悲观了:首先,中文互联网总体的信息量,比起英文互联网有着数量级的差别。


除了数据的量,数据的质也有问题。我们知道,严肃的知识内容,比方说最新的科技期刊、金融分析等,几乎都以英文行于世。


巧妇难为无米之炊,从这个意义上说,即使是OpenAI原班人马搞一遍中文模型,我感觉在对话流畅程度、信息正确性等方面,也会有一定差距。这个倒也不是完全没办法——把英文的语料翻译过来就得了呗!不过那就还要依赖翻译的质量,这路就越走越绕了。


说个具体例子,要不是微软收购了GitHub,你以为ChatGPT能学会写代码?


当然,中文互联网也不是全无优势。ChatGPT解决的是个人机对话问题,人人对话数据显然是有直接价值的重要语料,而在这个领域,有家中国公司的数据,可以说在全球范围内那是蝎子拉屎——独一份儿。只不过,这家公司是否愿意积极投入基础研究,就不得而知了。


再说说软条件,这个我觉得才是最难的:发自内心的长期主义。


ChatGPT一出,所有的一二级市场,都蠢蠢欲动起来了。这两天,我也接到很多找我交流的电话,让我这个二手科学家都应接不暇。他们最急迫地想得到答案的问题是:这东西能在哪些商业场景落地?市场潜力有多大?


从这些问题里,我感觉大家有个误解:似乎随着ChatGPT的推出,自然语言和人机对话的研究,就到了关底了,得赶紧想想摘桃子、分蛋糕的事儿!

哪儿有那么容易啊!其实,这次的ChatGPT让很多做垂直领域自然语言处理的公司非常尴尬:前几年做法律文书的、广告文案的,你领域化深耕的哪个模型,现在还不如人家通用模型啦!这就好比大家一起去野外探险,发现个铜矿,有几位就赶紧掉队挖起来了,可是等人家再往前走找到金矿,您挖的那点铜,早没人要了!


我们上面也说了,ChatGPT的成功,某种意义上要归功于它开始就选择了一条更曲折但是更光明的道路。包括谷歌在内,这些一流团队的一个共同特质,是在完全看不见目标还有多远、遑论有什么商业模式的漫漫长夜里,还能坚定地努力,并不戚戚于大概率的失败。


这样的长期主义,才是今天中国的AI研究最需要的。否则,即使这回你跟上了,下回人家再发现个钻石矿,谁能保证你还一定能跟上?


当然,咱也不能站着说话不腰疼,这么做需要有足够的家底儿,要不然走着走着饿死了咋办。不过,对中国的一些大厂来说,连送个菜都能先砸几百亿,我觉得他们的家底儿根本不是问题。


好了,咱们聊了这么多,那么中国正在如火如荼举行着的ChatGPT吹牛逼大赛,结果将会如何,您是不是已经有了自己的判断?




加入星球,探讨用户增长与变现专业话题

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
华尔街交易员为何不担心ChatGPT抢饭碗?ChatGPT:我预测不了市场ChatGPT到底有多聪明?我测试了ChatGPT的数学能力重磅 | 我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此金融民工会因为ChatGPT下岗吗?刚刚,我问了ChatGPT 24个金融圈灵魂问题为什么ChatGPT这么强?—— 一文读懂ChatGPT原理!ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!微信回应头像褪色,部分C刊不准隐瞒ChatGPT使用,微软推进裁员,Opera新版集成ChatGPT,这就是今天的其它大新闻!一年一度春节营销大赛,谁能“兔”出重围?三年防疫成败,九问习近平白纸运动是政府发起的吗?我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患ChatGPT和GPT-4胜出基于四个方面ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布白热化的城市竞争,谁将胜出?| 专精特新峰会ChatGPT 进军 B 端?消息称微软将允许企业创建定制版 ChatGPT重磅!微软发布 ChatGPT 版搜索引擎,用上了比 ChatGPT 更强大的技术黄渤的父亲剽窃、作弊,ChatGPT竟偷偷生成了12篇署名论文!Marcus炮轰Ta变成CheatGPT孟晚舟将首次出任华为轮值董事长/ 百度All in类ChatGPT项目/ 知乎因ChatGPT大涨50%…今日更多新鲜事在此下载量暴增10倍!微软必应集成ChatGPT后需求大爆发;4省份上调最低工资标准;淘宝已屏蔽ChatGPT关键词丨邦早报【周末综艺会4期】写故事的人朋友圈全是ChatGPT! ChatGPT概念股大火ChatGPT引发人工智能浪潮,苹果、亚马逊、Meta、谷歌、微软、英伟达,谁能占据上风? |【经纬低调分享】秀出天际!《霸王别姬》后,又横空出世一部牛逼大作…跟ChatGPT,聊聊ChatGPTChatGPT因访问量激增崩了;抖音否认3月1日上线外卖服务;百度将于3月推出ChatGPT产品丨邦早报全球都为ChatGPT疯狂,它到底是风口还是虚火?深度解读风暴眼中的ChatGPT | 直播预约紧急提醒!ChatGPT成神器!但这些“ChatGPT”是假的,小心被骗!GPT-4发布!谁能迭代ChatGPT?还得是OpenAI自己ChatGPT 或导致 20 种工作失业?恐怕远远不止,比尔盖茨 :ChatGPT 将改变世界ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!唐伯虎《风木图卷》反击!Google 版 ChatGPT 首次亮相,有一个功能「碾压」ChatGPT
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。