疯狂出圈的ChatGPT

公众号新闻

2023-02-19 01:02

(⊙_⊙)

每天一篇全球人文与地理

微信公众号：地球知识局

NO.2405-疯狂出圈的ChatGPT

作者：Ziiiying

校稿：辜汉膺 / 编辑：金枪鱼

ChatGPT，一时间火爆全网的新晋“网红”，正被议论的纷纷扬扬。能与人类“对答如流”，会写策划方案和调研报告，写诗翻译不在话下，甚至能通过谷歌L3程序员面试。

ChatGPT上线仅2个月，活跃用户就“狂飙”破亿。

上一个下载神话是由我们都熟悉的抖音创造的

尽管如此，依然耗时9个月 ▼

温馨提示：我局有个赛博朋克微信群，面向未来的科技的朋友们别错过文末的加群方式哦！

ChatGPT有多智能？

前不久，ChatGPT参加了谷歌招聘的编程面试，主要问题是技术，比如图/树，数组/字符串，动态规划，递归等等复杂算法。而根据它的回答表现，谷歌确定可以将它聘为L3工程师。虽然L3只是谷歌工程团队的最入门的职级，但依然可以秒杀一众码农，网站显示，谷歌L3程序员的年薪为18万美元。

只要再开发一个AI训练它给自己优化编程

那么chatgpt实现自我迭代也是早晚的事

（图：壹图网）▼

除了替代人类码农，ChatGPT能完成的任务不限于：给科学论文当共同作者、给以色列总统讲话写稿子、顺利通过美国医生职业考试；留学生用它来写文书、员工用它写邮件、编剧用它写剧本、备考公务员的求职者用它写申论，甚至只要你要求到位，它还可以帮你发布一段小红书……

chatgpt在写论文上的优秀表现已经引起学术圈的警惕

nature在期刊上发表多篇文章，倡议审慎地对待它

（图：nature）▼

网上流传着一个段子，有人说AI最可怕的地方在于，“你给它资料，它真学”。作为一款拥有卓越学习能力的聊天软件，ChatGPT表现出极强的“求知欲”。

下面为一名记者与ChatGPT的对话实例——

请写一首关于春天的五言律诗。

好的，这是一首关于春天的五言律诗：

春日百花开，绿水鸟语和。

微风吹柳絮，春意浓浓多。

山青水碧，世界宁静美。

春天到了，生机盎然。

这不是五言律诗，请写一首五言律诗。

对不起，我的错误。

下面是一首关于春天的五言律诗：

春色渐浓，山青水绿。

微风轻拂，花儿香甜。

鸟语花香，世界宁静。

春意盎然，生机勃勃。

你错了！

对不起，我再次错误。请告诉我如何改进。

请写一首描绘春天的五言律诗，五言律诗是指每句话只有五个字。

好的，这是一首描绘春天的五言律诗：

春风绿柳阴，花开水面清。

山青水碧绿，世界安详明。

鸟语花香里，微风轻拂生。

春意盎然处，生机勃勃情。

记者测试发现，“聪明的”ChatGPT也会给出错误答案，只是，当用户指出错误时，它会主动提出“请告诉我如何改进”的要求，并进行多次尝试。

与传统的AI相比，它的优势在于能够根据实际情况给出真实性的指导，而不是简单的一问一答式，并且会根据用户反馈持续化更新与学习。提出的问题越详细，回答的结果越真实精细化。

这种强大到可怕的能力，让处境不同、身份不同的人们喜忧参半。

虽然它有说瞎话的毛病，但是认错的态度总算是积极

（图：与chatgpt聊天）▼

一方面，很多人庆幸自己从工作生活中解放了出来：调查显示，89%的美国大学生承认使用ChatGPT做家庭作业，53%的学生用它写论文，48%的学生使用ChatGPT完成测试。美国密歇根大学一名学生前不久使用ChatGPT生成的哲学课小论文“惊艳”了教授，得到了全班最高分。

另一方面，许多人担忧它是否会取代自己的饭碗。ChatGPT可以根据人类提出的需求即时生成业务代码，几秒内完成一段漂亮的销售文案，给不少基层打工者带来了压力。就连各大科技巨头也为自己可能受到威胁的业务而着急上火。

看这改稿能力，和一些专业的改稿程序可以媲美了

（图：nature）▼

前不久，苹果公司召开内部员工的紧急会议，以应对ChatGPT的挑战。

谷歌公司CEO桑达尔・皮查伊周一在内部备忘录中告诉员工，需要尽快推出产品来抗衡最近爆红的ChatGPT，公司将要求所有人都来测试其新推出的对标ChatGPT的语音机器人“巴德”(Bard)，员工们甚至拿出在内部进行黑客马拉松的精神来测试它。

这不像是商业市场中试图与之分庭抗礼的姿态

更像是被打了措手不及之后的赶鸭子上架

“骇客松”（图：壹图网）▼

除此之外，谷歌创始人谢尔盖・布林已经开始亲自下场写代码，自他2019年离开谷歌一线以来，这还是第一次，这显示出谷歌领导层对ChatGPT的巨大危机感。

世界首富、曾经的ChatGPT合伙人、新任推特老板马斯克这样评价道：“ChatGPT好的吓人，我们离强大到危险的人工智能不远了。”

近期，微软创始人比尔·盖茨将ChatGPT融嵌入自家各线产品，使公司市值一夜飙高5400多亿。他在接受采访时也说道：“ChatGPT的意义，不亚于PC和互联网诞生。”

搭载了chatgpt技术的微软新搜索引擎new bing

真的能像它名字一样牛逼吗？（来源：bing）▼

ChatGPT的迭代之路

首先，让我们来了解一下ChatGPT的前世今生。ChatGPT是OpenAI在2022年11月30日推出的可以用对话方式进行交互的智能机器人。它的诞生经历了GPT→GPT1→GPT2→GPT3→ InstructGPT👉ChatGPT的迭代过程。

GPT的全称，是Generative Pre-Trained Transformer（生成式预训练Transfomer模型）是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型。

Transformer模型框架和GPT优化后的模型对比 ▼

2018年，GPT-1诞生，该模型可以用于一些简单的自然语言处理任务中，比如句子关系判断，语义相似度识别，文本分类，但它对训练样本之外的新鲜数据适应能力低，只能算得上一个语言理解工具，而非对话式AI。

GPT模型的核心主张1-预训练(pre-training)

先填鸭式自学、再针对性辅导

（图：REEBUF）▼

2019年，GPT-2问世，模型使用了更多的网络参数与更大的数据集：最大模型共计48层，参数量达15亿，在生成任务的性能方面展现出了普适而强大的能力，可以聊天、阅读摘要、新编或续写故事，还能编造假新闻、生成钓鱼邮件，就连在网上进行角色扮演也不在话下。

这个阶段则是去掉了监督微调阶段

试图解决zero-shot问题，数据集也是跨越式地增长

（来源：《Language Models are Unsupervised Multitask Learners》）▼

而后，GPT-3出现了，作为一个自监督模型(在人工标注的数据中通过自己监督自己来学习到有用的信息)，它可以捕捉所有的历史上下文信息，作为丰富的语料供模型学习，拥有1750亿的参数量，几乎可以完成自然语言处理的绝大部分任务。

在少量样本学习下的综合表现是理想的

（来源：《Language Models are Few-Shot Learners》）▼

例如面向问题的搜索、机器翻译、文章生成和自动问答等等，且模型在诸多任务上表现卓越，例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平，自动产生的文章几乎让人无法辨别出自人还是机器，在两位数的加减运算任务上达到几乎100%的正确率，甚至还可以依据任务描述自动生成代码。

可能是码农们自己也受够了每天输入一些繁琐的代码

（来源：nature）▼

2022年初，OpenAI发布了InstructGPT，通过监督学习（用标记数据集来训练特定任务的算法）+人类反馈中获得的强化学习方法，来提高GPT-3的输出质量。InstructGPT能够更好地遵循用户意图，且能将有害的、不真实的和有偏差的输出最小化。

现在，我们每个用户都是chatgpt的训练师

免费的纠错劳动力和数据集

（来源：Qin-《InstructGPT 浅析》）▼

当时间来到这一年年末，加强版模型ChatGPT问世了，这个模型沿用了监督学习与强化学习算法，另外在数据训练过程中，通过将模型生成不同结果的优劣进行人工评估，从而将模型进一步优化，再次提高了模型回答的质量。

由此可见，如此高大上的神器，前期也经过了不断摸索与演化的过程，才以如今的样子呈现在我们面前。强大的技术底座赋予它的能力，主要体现在三个方面：复杂的问题处理能力、广泛的场景应用能力、基于用户反馈的持续化更新与学习能力。

最终，还是钞能力成就了这一领域的奇迹

（图：shutterstock）▼

ChatGPT价值在何方？

目前，ChatGPT固然存在一些局限，但它给我们带来的革新与潜在的想象空间无疑是巨大的。小到个人与企业，大到人类与社会，它会成为历史上一个值得铭记的里程碑。

Generative AI风投市场表现充满朝气 ▼

纵观人类的历史，就是不断寻找最精确信息的过程。

我们的祖先跨越海洋，攀登高山，冒着疾病的危险去收集最优质的信息，拜访那些充满光明的地方。不论是为了去领略亚历山大图书馆中的智慧，参加高等学府的学习，都需要付出时间和旅程的成本。不论黄页还是大英百科全书，它们提供的价值都是让人类更快地获取信息。

知识是人类进步的阶梯

（图：shutterstock）▼

本来需要去图书馆或步行到镇上才能解答的问题，突然间可以在几分钟内，就可以得到解决。在此之前，谷歌凭借其搜索引擎一举成名。它成功的原因在于：缩短了从问题到答案的距离，并找到了一种将其货币化的方法。

遇到不懂的问题，我们首先会想到去“谷歌一下”

（图：壹图网）▼

有观点认为，ChatGPT会颠覆搜索行业，但同时我们也看到了它存在的局限。

比如，目前ChatGPT主要查到的都是2021年的信息，ChatGPT无法知道谁赢得了中期选举，不知道参加卡塔尔世界杯的球队是赢了还是输了，不知道埃隆·马斯克是推特的CEO，此外，ChatGPT目前还不支持图片搜索。

这与chatgpt模型的数据集有关

不过随着进一步迭代，相信它会更好地修正 ▼

ChatGPT不仅会编造虚构的学术论文引文，凭空捏造一个不存在的定理，而且当用户需要更多维度的体验，想要调查而不是去寻找某个即时确定的答案时，ChatGPT会不胜其任。

另外，其高昂的价格可能也会限制它的使用范围。即便如此，目前订阅价在20美元每月的ChatGPT对各垂类企业仍具极大的吸引力，哪怕它的价格还会不断上涨——用于法律、医学、工程、软件开发、销售、房地产等各行各业的垂直化聊天机器人会大大缩减成本，创造更高的价值。

更多商业投资的涌入，更多产业集中，成本也更低

（来源：youtube）▼

譬如在搜索场景中，聊天机器人会比网页广告更有优势，因为当客户像是在与真人对话时，会有更高的商业转化率。

ChatGPT就好比信息时代的图书管理员，将谷歌的数据海洋、大量的人类知识转换为清晰、维度更简单的答案。毕竟，谷歌虽然可以给你10万个答案，但一个图书管理员却可以给你最为精准的答案。

以“一位人工智能图书管理员在数据海洋里找资料”为提示

从百度的图形生成AI大模型"文心一格"生成的画像

（来源：文心一格）▼

参考资料：

1、论文：《Improving Language Understanding by Generative Pre-Training》

2、论文：《Attention is all you need（Transformer）》

3、https://finance.sina.com.cn/jjxw/2023-02-09/doc-imyfafhw6230591.shtml

4、https://www.woshipm.com/ai/5704153.html

*本文内容为作者提供，不代表地球知识局立场

封面：爱死机

END

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章