Redian新闻
>
谷歌怕了,ChatGPT一拳打死老师傅

谷歌怕了,ChatGPT一拳打死老师傅

科技

作者 | 荣智慧


很少见到科技巨头“惊慌失措”。去年美国科技股大跌,五家科技巨头市值一度蒸发1.8万亿美元,相当于跌去一个谷歌。那时候,也没人见谷歌“慌”过。


2023年伊始,微软给OpenAI砸了100亿美元,又先后把OpenAI的聊天机器人ChatGPT整合进Office办公软件以及多年来半死不活的必应搜索引擎——谷歌开始慌了。


谷歌CEO桑达尔·皮查伊的动作紧锣密鼓:把“退隐江湖”的两位创始人拉里·佩奇、谢尔盖·布林拉回来“看代码”,向AI初创公司Anthropic投资了近4亿美元,并于2月7日公开了自家竞品——聊天机器人“巴德”。


诙谐的一幕是,8日,谷歌在巴黎举行AI发布会,巴德在演示中“张冠李戴”:回答“韦伯空间望远镜的新发展”时,巴德说的成就是另一台望远镜的。


出师未捷已翻车,谷歌输了。


要注意的是,搜索引擎和语言模型,不是一回事。谷歌到底为什么那么慌?



人造智商考验人类智商

谷歌的慌张,来自于ChatGPT的“耀眼”。


2022年被称为“AIGC”(AI Generated Content)元年,而元年的集大成者就是ChatGPT。


去年,一系列AIGC应用均达到了“亲民”级别。先是Disco Diffusion、Dall-E 2、MidJourney等“文生图”工具触手可及,又有Stable Diffusion通过“去噪模式”,将AI图像生成的效率和精度提升到全新的境界。


ChatGPT是由OpenAI开发的一个人工智能聊天机器人程序,在2022年11月推出。


年轻人用ChatGPT与AI聊天,得到详细回复 / 视觉中国


去年年底,ChatGPT上线,五天内注册人数超过一百万,两个月内达到一亿。为到达这一目标,推特可用了五年。ChatGPT通过“理解”对话者的语义,能和人类进行有效、连续的反馈,几乎达到“以假乱真”的地步。

对于用户来说,和ChatGPT聊天就是在对话框“打字”,除此之外,它也可以用于相对复杂的语言工作,包括自动文本生成、自动问答、自动摘要等在内的多种任务。 


ChatGPT使用的是基于GPT-3.5架构的大型语言模型,通过强化学习进行训练。较之已经能写论文的GPT-3,它最重要的变化是建立在人类真实反馈基础上的调校,而训练语料还不如GPT-3多。GPT-3用了45T的文本,ChatGPT用了500G的文本——还只限于2021年。


GPT-3.5使用的新的AI训练方法,就是加大“人”的反馈权重:标记者在模型中书写期待的回复,AI的回复越贴近人的“期待”,排名就越高。排名越高,模型就越能得到奖励。之后,在持续参数迭代的过程中,输入奖励模型,就能得到优化参数。


这就是为什么ChatGPT能用北京话“捧哏”。你鼓励它说“您瞧瞧”“多说几句带儿化音的北京话”,它马上就回复你“好嘞”“这碗炒肝儿盖了帽儿了”!


ChatGPT是基于GPT-3.5优化的模型,可以理解为一个通用聊天机器人 / 《我,机器人》剧照


就凭借这种“上下文”理解能力,ChatGPT的本事恐怕真超过不少直男,毕竟不少后者还纠结于“多喝热水”的有效性,或者上论坛提问“她说这句话到底什么意思”?


人造智商考验人类智商。


聪明的学生首先想到用ChatGPT写作业,搞得OpenAI不得不给“答案”加“水印”。学术界也非常紧张,《科学》和《自然》等顶级刊物,已经明确禁止将ChatGPT列为合著者,前者还不允许论文使用ChatGPT生成的文本。


ChatGPT模型如此厉害,和搜索引擎又有什么关系?


某种意义上,ChatGPT是问答类媒体、知识付费另一种面貌,更像Quora、知乎。你想快速知道一种技能、一条信息、一个答案,ChatGPT立刻“稳准狠”作答(有时也不准)。


搜索引擎恰好没有“稳准狠”的特点。



搜索引擎效率低

有一定“冲浪”经验的网友,多半还记得这句话:“外事不决问谷歌,内事不决问百度”。“决什么”,如今是搜索引擎和语言模型的岔路口。


如果是“决”精确性,搜索引擎不如语言模型。


如果是“决”相关性,语言模型不如搜索引擎。


搜索引擎用来信息检索、知识发现,而语言模型用来问题求解。


根据统计机构StatCounter公布的数据,2023年1月,谷歌在全球搜索引擎市场的份额高达92.9%,而微软的必应只有3.03%


举例而言,比如搜“高超音速导弹”,搜索引擎会列出很多相关页面,其中既有高超音速导弹的定义,也会有它的新闻、历史以及各种趣谈——是“图书馆”层面上的;语言模型会告诉你一个“高超音速导弹”的定义,是“文本”层面上的。


也就是说,语言模型的作用,相当于搜索引擎的一个子集——好比你不用在“军事武器”的书架周围来回晃悠,管理员直接塞来一本书。


搜索引擎的优点,是更加开放,来源清晰,更多展示知识的相关性;缺点就是提供的内容不精确,更“散”。相比之下,语言模型因为“训练”过,高度“切题”。


它们的差异,源自背后的技术差异。搜索引擎的本质是算法,模型的本质是目标函数。


让用户对搜索结果进行筛选的方式很快就会被时代抛弃 / 视觉中国


搜索引擎公司一直明白“不精确”的致命之处。一个页面上十条“高超音速导弹”信息,绝大多数用户不知道如何分辨、梳理和确证,陷入乱花渐欲迷人眼的低效率之中;或者搜索引擎的“算法”失之偏颇,提供太多的“广告”置顶,极大破坏了用户的信任,甚至误人生命。


Quora、知乎类产品的火爆,某种程度上起到“纠正”搜索引擎的作用:通过真人/专家的“现身说法”,为用户提供高质量的信息集合。不过,事实证明UGC的风险很大——人人都成了“专家”的时候,“现身说法”也就成“故事会”了。


语言模型的语料库经过筛选,内容更有保障,反应更加迅速,再加上准确度较高,对搜索引擎造成了很大威胁。


因此,当微软说把ChatGPT放进Office里时,谷歌还比较淡定;一说要加进必应,那真的是“触及灵魂”,谷歌立刻行动起来,盘点一下模型家底——LaMDA,Sparrow,Claude,PaLM……


谷歌CEO桑达尔·皮查伊把“退隐江湖”的两位创始人拉里·佩奇(右)、谢尔盖·布林拉回来“看代码” / 视觉中国


也不是说语言模型就没有缺点。


首先,它是哪个词用得多就重复哪个,容易陷入“同义词反复”的境地;其次,因为要和人交流,它的“三观”根正苗红,绝对不讲政治不正确的话,想要了解历史的人恐怕还得费点功夫;另外,语言模型就是经“诱导”而来,只要“诱导”它就会跟着走,杠是不会杠,但“谄媚”的“核心”往往是胡说八道。



“快”是最大需求

谷歌的惊慌,更深层的原因恐怕还是了解人,或者说,了解今日的用户。


最火爆的应用和社交平台,主打的都是“无脑”且简单粗暴的内容提供方式。用户只需要看过若干内容,后续就不用自己筛选信息、分辨源头、思考真伪了,应用会通过“标签化”的算法,一股脑推送最符合“个人口味”的东西,令人欲罢不能。


如果说社交平台给的是量身打造的娱乐,那么ChatGPT给的就是量身打造的“知识”。整个社会的潮流是,知识可以通过非常便利、简约的技术直塞给大众,而不是个人通过较长的、曲折的学习过程自行获得。


Google LaMDA(左)和 ChatGPT(右)界面对比


近日谷歌CEO桑达尔·皮查伊的发言一针见血。他说,“AI加深我们对信息的理解,高效将其转化为有用的知识,帮助人们在搜索时更容易地找到核心、达成目的。”


这就是搜索引擎渴望语言模型加持的一大要义:用户越来越不耐烦,所有的技术都要冲刺“快”和“准”。


就连武器发展也是这样。高超音速导弹,俄罗斯去年先投入战场,随后美国也宣布试射成功,据悉将在日本部署。它的恐怖之处就是快,对手可能来不及反应。


更进一步说,人工智能发展也太快了。大概十二年前,刚刚出现神经网络的概念,吴恩达在谷歌搞了一套新玩意,在没有标记的数据集里,AI学会了辨认锐角三角形。没几年,AI围棋也下得,汽车也开得,还能预测蛋白质结构,如今要抢各位小编、画家的饭碗。


马斯克在2022年12月公开表示:ChatGPT好得吓人,我们离强大到危险的人工智能不远了


正是因为发展快,谷歌这样的巨头才额外担心。要知道,谷歌索引的数据量超过10万T,GPT-3才用了45T。所谓“AI一日,人间一年”,一步落后,步步落后,巨头也得未雨绸缪。


微软联合创始人比尔·盖茨对ChatGPT评价很高:“这种人工智能技术的诞生有着重大的历史意义,不亚于互联网或个人电脑的诞生。”


也许,“历史意义”正体现在人工智能和人类两者的“混淆”:人工智能越来越像人,甚至比人能力强;人要越来越像机器,必要时可以使用各式各样的“增能”手段。


人工智能会取代人类吗?/ 《机械姬》剧照


或者,我们可以把比尔·盖茨说的“历史意义”拆成两方面。


在信息检索和问题求解的意义上,搜索引擎和语言模型的结合,带来的是更加便捷的信息处理工具。各家科技公司的竞争将创造体验更优秀的产品,值得欢迎。


在内容生产的意义上,ChatGPT应该给所有媒体提了一个醒:以人海战术,对信息剪切粘贴,或者靠堆叠专家的话来增加“分量”,真的有ChatGPT做得好吗?


它也给所有写作者提了一个醒:今天写得比GPT-3.5好,明天能比得过GPT-4吗?如果不能,咱们大家干点什么去?


文中配图部分来源于视觉中国,部分来源于网络



    编辑 | 向由

新媒体编辑 | 莫奈

排版 | 八斤



点击图片 即刻订阅



南风窗新媒体 出品

未经授权 禁止转载

欢迎分享至 朋友圈


投稿、投简历:[email protected]

广告、商务合作:

 handaxiao222

记得星标!点点在看让理性的声音传得更远



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
ChatGPT一路狂飙,我们的安全带在哪儿?集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布早报 | ChatGPT Plus突然停售;徐翔应莹离婚案宣判;翟欣欣索要千万逼死老公案宣判;华为余承东入职小米汽车?回应来了自度曲 《冬 残》(稿)离谱!太过沉浸VR游戏,新加坡女子竟一拳打碎屏幕ChatGPT一出,软件工程师先丢饭碗?ChatGPT一出,这10大职业可能先丢饭碗!人工智能取代医生还有多久?ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!谷歌Bard被曝直接抄ChatGPT数据,BERT一作投诉CEO后投奔OpenAI我,ChatGPT,站在谷歌的肩膀上,让谷歌紧张年迈父母怎么度过新冠风暴?陶斯亮的一拳把司马南打怕了,顺带还捎上了饶毅......早财经 | ChatGPT Plus突然停售;“索要千万逼死老公案”一审宣判;上市公司两任董事长同日被“双开”微软又给谷歌双重暴击,ChatGPT或将加入Word、PPT和Excel!在一篇由 GPT-3 生成的论文中,ChatGPT 重现了图灵测试的原始论文谷歌Bard被曝剽窃ChatGPT?BERT一作跳槽OpenAI,揭惊天内幕挺能忽悠也会瞎编!ChatGPT一小时生成的研报刷屏,内容靠谱吗?有券商分析师直呼,"肯定会替代人工"中国抗击疫情到了重要转折关头ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!独家|我们和ChatGPT一起专访了《人类简史》作者尤瓦拉·赫拉利礼向上,法向下预览别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出知否知否,C4ISR系统是俄乌战场的阿尔法狗,ChatGPT!剽窃、作弊,ChatGPT竟偷偷生成了12篇署名论文!Marcus炮轰Ta变成CheatGPT危!ChatGPT一出,这几大职业可能先丢饭碗!撩了ChatGPT一晚上,我发现真正细思极恐的是这件事微软又给谷歌「双重暴击」,ChatGPT或将加入Word、PPT和Excel!ChatGPT一出,这10大职业可能先丢饭碗OpenAI发布GPT-4:能识图能算税,ChatGPT摆脱Chat,再次进化别只骂谷歌Bard了,ChatGPT加持的微软New Bing也错误频出ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇谷歌Bard是拿ChatGPT数据训练的?BERT一作抗议无果,跳槽OpenAI...科早ChatGPT:如何应对ChatGPT?二级市场闭门研讨会精选 | S7E01 硅谷徐老师为什么美国在全球找敌人?中国在全球找朋友?符尧@爱丁堡大学:ChatGPT一系列大模型背后的技术演化过程!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。