这本书就是展现它未来的模样
(扫上图二维码即可订阅喜马拉雅平台老牛读书会)
昨日AI已是今日生活,了解今日AI让你看见明日未来。这本书展现的就是它未来的模样。
——芬兰图尔库大学算法研究客座教授,《计算机游戏的算法和网络》、《交互式故事讲述手册》作者 乔尼·森德(Jouni Smed)
2022年12月16日,Science杂志发布了2022年度科学十大突破,AIGC(人工智能生成内容,AI Generated Content))赫然在列。一时间,AIGC成为当下最炙手可热的概念。
无论是横空出世的AI绘画,还是势不可挡的ChatGPT,都属于AIGC这一概念。谁曾想到,在元宇宙、Web3.0等概念风靡的2022年,AI凭借“创作”强势崛起。这也预示着AIGC元年即将开启,下一个万亿赛道即将爆发。
什么是AIGC?它起源于何方、它的技术思想是什么?它对资讯、影视、电商、教育、金融、医疗行业会产生什么样的颠覆性影响?它又是如何运用到产品研发、市场营销、管理协作的?它的上中下游产业链是什么,未来会引领我们走向何方?
小编今天就给大家推荐一本由中译出版社本月新鲜出炉的新书《AIGC:智能创作时代》。
本书结合生动的比喻和有趣的案例,向所有关注未来科技的从业者、创业者、投资人、政府部门科普了上述一系列问题,让每个人都能读懂 ChatGPT、更好地了解并把握AIGC带来的行业机遇、一起迎接全新的智能创作时代。
老牛精选
《AIGC:智能创作时代》
杜雨 张孜铭著
中译出版社
从机器学习到智能创造
不知道你有没有想过这样一个问题:是什么让我们得以思考?
从如同一张白纸的婴儿,成长为洞悉世事的成人,正是长辈的教诲和十年寒窗塑造了我们如今的思考力。学习,似乎就是智能形成的最大奥秘。
人类崇尚智能,向往智能,并不断利用智能改造世界。走过农业革命,迈过工业革命,迎来信息革命,一次又一次对于生产力的改造让人们相信,人类的智能最终也能创造出人工的智能。
数十年前,图灵抛出的时代之问“机器能思考吗?”,将人工智能从科幻拉至现实,奠定了后续人工智能发展的基础。之后,无数计算机科学的先驱开始解构人类智能的形成,希望找到赋予机器智能的蛛丝马迹。
正如谷歌秘密研究实验室Google X创始人塞巴斯蒂安·特伦(Sebastian Thrun),所言:“人工智能更像是一门人文学科。其本质在于尝试理解人类的智能与认知。”如同人类通过学习获得智能一样,自20世纪80年代起,机器学习成为人工智能发展的重要力量。
机器学习是指让计算机从数据中汲取知识,并按照人类所期望的,按部就班执行各种任务。机器学习在造福人类的同时,似乎也暴露出了一些问题,这样的人工智能并非人类最终期望的模样,它缺少了人类“智能”二字所涵盖的基本特质——创造力。
这个问题就好像电影《我,机器人》中所演绎的一样,主角曾与机器人展开了激烈的辩论,面对“机器人能写出交响乐吗?”“机器人能把画布变成美丽的艺术品吗?”等一连串提问,机器人只能讥讽一句“难道你会?”。这也让创造力成为区分人类与机器最本质的标准之一。
电影《我,机器人》剧照
人类的智能真的不如机器?
面对庐山雄壮的瀑布时,李白写出“飞流直下三千尺,疑是银河落九天”的千古绝句,感慨眼前的壮丽美景;
偶遇北宋繁荣热闹的街景时,张择端绘制出《清明上河图》这样的传世名画,记录下当时的市井风光与民风淳朴;
邂逅汉阳江口的知音时,伯牙谱写出《高山流水》,能拉近秋夜里两位知己彼此的心灵。
我们写诗,我们作画,我们谱曲,我们尽情发挥着创造力去描绘我们的所见所闻,我们因此成为人类的一分子,这既是智能的意义,也是我们生活的意义。
但是,人类的创造力真的不能赋予机器创造力吗?答案显然是否定的。
在埃米尔·博雷尔1913年发表的《静态力学与不可逆性》论文中,曾提出这样一个思想实验:假设猴子学会了随意按下打字机的按钮,当无限只猴子在无限台打字机上随机乱敲,并持续无限久的时间,在某个时刻,将会有猴子能打出莎士比亚的全部著作。
虽然最初这是一个说明概率理论的例子,但它也诠释了机器具备创造力的可能性。只不过具备的条件过于苛刻,需要在随机性上叠加上无穷的时间量度。
在科学家的不懈努力下,这个时间量度被从无限缩减至了有限。随着深度学习的发展和大模型的广泛应用,生成型人工智能已经走向了成熟,人们沿着机器学习的路,探索出了智能创造的今天。
在智能创作时代,机器能够写诗,能够作画,能够谱曲,甚至能够与人类自然流畅地对话。人工智能生成内容(AIGC)将带来一场深刻的生产力变革,而这份变革也会影响到人们工作与生活的方方面面。
AIGC:开启智能创作时代
面对互联网内容生产效率提升的迫切需求,人们突发奇想,是否能够利用人工智能去辅助内容生产呢?进入互联网时代后,产生了所谓专业生产内容(PGC),也出现了以此作为职业获得报酬的职业生产内容(OGC)。与此同时,“用户生成内容”(UGC)的概念和技术也逐渐发展,由此形成了用户内容生态。
相较于PGC、OGC和UGC,AIGC通过人工智能技术实现内容生成,并在生成中注入了“创作”,意味着自然智能所“独有”和“垄断”的写作、绘画、音乐、教育等创造性工作的历史走向终结。内容生成的四个阶段(见下图):
内容生成的四个阶段
正如人们最初眺望WEB3.0时构想的“语义网”一样,未来的互联网应该是更加智能的互联网,它不仅能够读懂各种语义信息,还能从信息角度解放人类的生产力。
让人工智能这样的非人机器学会创作绝非易事,科学家在过往做了诸多尝试,并将这一研究领域称为生成式人工智能(Generative AI)(本书未对生成式人工智能和AIGC特别加以区别,均以AIGC代之),主要研究人工智能如何被用于创建文本、音频、图像、视频等各种模态的信息。
虽然各种类型的AIGC应用不断涌现,但在此前并未获得全社会的广泛关注。2022 年下半年,两个重要事件激发了人们对AIGC的关注。
2022年8月,美国科罗拉多州博览会上,数字艺术类冠军颁发给了由AI自动生成并经由Photoshop润色的画作《太空歌剧院》,该消息一经发布就引起了轩然大波。
该画作兼具古典神韵和太空的深邃奥妙,如此恢宏细腻的画风很难让人相信它是由AI自动生成的作品,而它夺得冠军的结果也大大冲击了人们过往对于“人工智能的创造力远逊于人”的固有认知,自此彻底引爆了人们对于 AIGC的兴趣与讨论,AIGC也从看似遥远的概念逐步以生动有趣的方式走入人们的生活,带来了过去令人难以想象的丰富体验。
2022年11月30日,OpenAI发布了名为ChatGPT(Generative Pre-Training,中文意思为生成式预训练)的超级AI对话模型,再次引爆了人们对于AIGC技术的讨论热潮。
AIGC的核心技术价值是实现了”自然语言”与人工智能的融合。自然语言是一个包括词法、词性、句法、语义的体系,也是不断演进的动态体系。
而ChatGPT则代表了AIGC的最新进展。它完成了机器学习算法发展中,自然语言处理领域的历史性跨越,即通过大规模预训练模型,形成人工智能技术理解自然语言和文本生成能力,能完成脚本编写、文案撰写、翻译等任务。
这是人类文明史上翻天覆地的革命,开启了任何阶层、任何职业都可以以任何自然语言和人工智能交流,并且生产出从美术作品到学术论文的多样化内容产品。在这样的过程中,AIGC“异化”为一种理解、超越和生成各种自然语言文本的超级“系统”。
ChatGPT不仅可以清晰地理解用户的问题,还能如同人类一般流畅地回答用户的问题,并完成一些复杂任务,包括按照特定文风撰写诗歌、假扮特定角色对话、修改错误代码等。
此外,ChatGPT还表现出一些人类特质,例如承认自己的错误,按照设定的道德准则拒绝不怀好意的请求等。
ChatGPT:目前功能最强大的AI文本生成器
作为新事物,很多人可能并还不清楚ChatGPT到底是什么?但其实,许多网友,早已接触过类似于ChatGPT的人工智能创作的内容。
在书中,作者简要列举了一些更加常规的、结构化的AIGC应用,例如2016年5月,四川绵阳发生4.3级地震时,中国地震台网开发的地震信息播报机器人,在6秒内写出了560字的快速报道;
2017年8月,当四川九寨沟县发生7.0级地震时,该机器人不仅翔实地撰写了有关地震发生地及周边的人口聚集情况、地形地貌特征、当地地震发生历史及发生时的天气情况等基本信息,还配有5张图片,全过程不超过25秒;在后续的余震报道中,该机器人的最快发布速度仅为5秒……
这种AI结构化写作,还可以被用于生成自动标题与摘要,它可以通过自然语言处理,对一篇纯文本内容进行读取与加工,从而生成标题与摘要。
例如输入文本内容:“今日,中国三条重要高铁干线—兰新高铁、贵广铁路和南广铁路将开通运营。其中兰新高铁是中国首条高原高铁,全长1776公里,最高票价658元。贵广铁路最高票价320元,南广铁路最高票价206.5元,这两条线路大大缩短西南与各地的时空距离。”可以得到AI返回的标题:“中国‘高铁版图’再扩容,三条重要高铁今日开通”。
而与前文所展示的例子不同,ChatGPT 可以同时作为问答、聊天及创作 AI 存在,它的使用场景日常且多样,融合了文案生成、小说续写、代码生成、代码漏洞修复、在线问诊等场景,甚至展现出了超越搜索引擎的潜力。
作者通过和ChatGPT对话,带着读者直观感受了ChatGPT 的强大功能,比如作者问ChatGPT
问:我想写一本关于 AIGC 的书,该怎么拟定大纲框架 ?
AI :第一部分:AIGC 的概述
·介绍 AIGC 是什么,它的基本概念和特点。
·讲述 AIGC 的发展历程,以及它的技术背景。
第二部分:AIGC 的应用
第一章 AIGC:内容生产力的大变革
·讨论 AIGC 在各个领域的应用情况。
·举例说明 AIGC 在客服、语音识别和翻译等方面的具体应用。
第三部分:AIGC 的未来
·展望 AIGC 的发展趋势。
·探讨 AIGC 在未来可能的应用场景。
第四部分:总结
除了写作辅导,作者还试一下它能不能教人表白。
问:我想要在 2022 年结束前,和我喜欢的人告白,请帮我想一段诚挚的告白的话。
AI :亲爱的,在这个即将结束的 2022 年,我想对你说:我喜欢你,喜欢你的一切。我喜欢和你在一起的感觉,感觉你陪伴的温暖。你是我一生中遇见的最特别的人,我希望我们能一直在一起,共度余生,请让我成为你的伴侣,与你共同走过这段旅程。
不会发朋友圈?不会写贺卡?也可以试试求助人工智能!
问:请帮我写一条朋友圈,表达我失眠的心情,同时体现我的文学才华。
AI :朋友们,今晚我又失眠了。我坐在床上,面对着漆黑的天花板,想象着各种奇怪的事情,挣扎着想要入睡,却始终如故。失眠之苦,唯有身在其中的人才能体会。
我想起了莎士比亚的名句:“夜深人静,空气中弥漫着一种诡异的气息。”是的,失眠之夜,就像漆黑的夜空,让人感到不安和孤独。
朋友们,你们有没有好的方法,能帮助我入睡呢?敬请指教。
这还不是最有趣的。最有趣的是,ChatGPT 具有很强的上下文连接与多轮对话的能力。ChatGPT 还具有记忆能力,当向它追问 “能不能再夸张一点”时,它可以在之前生成的文案基础上进行改写。这种连续对话大幅提高了人机交互体验。
问:能不能再夸张一点?
AI :朋友们,今晚我又失眠了。我翻来覆去,把被子打成了螺旋形,绷得紧绷绷的,就像拧紧了弹簧一样。失眠之苦,实在是令人难以忍受。
我想起了莎士比亚先生的名言:“夜深人静,空气中弥漫着一种诡异的气息。”是的,失眠之夜,就像漆黑的夜空,让人感到不安和孤独,我想,失眠之人,应该像受伤的勇士一样,坚强地挺过难关。我们要不屈不挠,不懈地努力,才能摆脱失眠的折磨,才能重新健康地
入睡。
朋友们,你们有没有好的方法,能帮助我入睡呢?敬请指教。
甚至当不会撰写代码的时候,你也可以尝试求助于 ChatGPT。不只是辅助编程,ChatGPT 甚至在一些测试中可以直接修改代码,并给出可以直接复制的代码示例,这在未来将极大减轻程序员的工作强度。
未来最火的职业是提示词(Prompt)工程师?
著名经济学家朱嘉明在本书的代序言中写道,伴随AIGC生成算法的优化与改进,AIGC对于普通人来说也不再是一门遥不可及的尖端技术。
AIGC在文字、图像、音频、游戏和代码生成中商业模型渐显。2B(to Business的简称)将是AIGC的主要商业模式,因为它有助于B端提高效率和降低成本,以填补数字鸿沟。
但可以预见,由于AIGC“原住民”的成长,2C(to Customer的简称)的商业模式将接踵而来。根据有关机构预测,2030年的AIGC市场规模将超过万亿人民币,其产业规模规模生态(见下图):
AIGC产业规模生态分布
现在,AIGC在语言模型领域的全方位竞争已经开始。所以才有微软对OpenAI的大规模投资,因为有这样一种说法:“微软下个十年的想象力,藏在ChatGPT里。”近日,谷歌宣布推出基于“对话应用语言模型”(LaMDA)的Bard,实现其搜索引擎将包括人工智能驱动功能。
ChatGPT刺激谷歌开始“创新者困境”突围。未来很可能出现Bard和ChatGPT的对决或共存,也就是LaMDA和GPT-3.5的对决和共存,构成AIGC竞争和自然垄断的新生态。
在这样的新兴产业构造和商业模式下,就业市场将会发生根本性改变:其一,专业职场重组,相当多的职业可能衰落和消亡;其二,原本支持IT和AI产业的码农队伍面临严重萎缩。因为AIGC极大刺激全球外包模式并取代码农。
《AIGC智能创作时代》一书中也举例说明了产品经理如何引导 ChatGPT 生成产品需求文档,训练 ChatGPT 根据自己之前写的周报自主修改周报。
根据用户 Jiayuan@Tisoga 在推特上分享的案例, ChatGPT 目前生成的产品需求文档内容完备且带有技术方案,未来产品经理需要做的可能只是和 ChatGPT 聊一下自己的想法以及项目相关背景,让 AI 生成一份草稿文档,再进行修改润色即可。
同样,用户也可以通过不断的提问引导 ChatGPT,层层递进完成从研究框架到研究报告的输出。先让 ChatGPT 生成报告大纲,再通过类似专家访谈一样一步步提问让 ChatGPT 补充报告内容,并在这个过程中根据其答案进行衍生提问,不断完善它的逻辑。例如,按照上面回答中的写作大纲,我们可以让 ChatGPT 继续写下去:什么是 AIGC?它的基本概念与特点是什么?
面对这样强大的功能,很难不让人幻想 AI 生成文本的未来:程序员、研究员、产品经理等涉及重复性工作的脑力劳动者可能都将被 AI 取代,这些职业可能都演变成了新的职业—提示词(Prompt)工程师,目的就是帮助人类更好地与 AI 互动。
智能创作时代正在缓缓拉开序幕
ChatGPT一上线,就引发网民争相体验,到处都是体验与探讨ChatGPT的文章和视频。
据小编亲测,ChatGPT对上至高考作文、下至情人节礼物之类的话题都能说上几段逻辑通顺、且找不出语法毛病的话来,甚至能对某本图书发表貌似客观的评论。
但当数据和所受训练不足以支撑它的回答,明显开始言之无物、顾左右而言他,甚至是一本正经地胡说八道。
最主要的问题,ChatGPT的回答四平八稳,看不出有明显的个人风格或是独立观点,这当然也跟它所受的训练有关。而且一旦涉及专业性强的问题,除了那些领域的专家之外,普通人根本无法判定ChatGPT给出的答案是否正确。
不过,正如朱嘉明老师指出的那样,AIGC的进化是参数以几何级数扩展为基础。AIGC形成的学习能力决定于参数的规模。GPT-2大约有15亿个参数,而GPT-3最大的模型有1750亿个参数,上升了两个数量级。
而且,它不仅参数规模更大,训练所需的数据也更多。根据媒体报道但还未被证实的消息,GPT-4 的参数可能将达到100万亿规模(见下图):
GPT-4的参数规模
根据学界经验,深度神经网络的学习能力和模型的参数规模呈正相关。人类的大脑皮层有 140多亿个神经细胞,每个神经细胞又有3万多个突触。所以,大脑皮层的突触总数超过100万亿个。
所谓的神经细胞就是通过这些突触相互建立联系。假设GPT-4实现100万亿参数规模,堪比人的大脑,意味着它达到与人类大脑神经触点规模的同等水平。
所以,我们有理由相信,人类的这一创造物终究会帮助人类自身的发展,AIGC 无疑是一种生产力的变革,将世界送入智能创作时代。
在《AIGC智能创作时代》一书中,作者将创作者生产力的提升表现归纳为三个方面:
• 代替创作中的重复环节,提升创作效率。
• 将创意与创作相分离,内容创作者可以从人工智能的生成作品中找寻灵感与思路。
• 综合海量预训练的数据和模型中引入的随机性,有利于拓展创新的边界,创作者可以生产出过去无法想出的杰出创意。
当然,AIGC也并非完美无缺,“人工智能生成的内容如何确定版权归属”“AIGC是否会被不法分子利用,生成具有风险性的内容或用于违法犯罪活动”等一系列问题都是现在人们争论的焦点。
目前,学界与业界在尝试从各个方面解决这些问题。但不管怎样,AIGC的迅猛发展已成不可逆转之势,智能创作时代的序幕正在缓缓拉开。
无论你接受与否,我们每个人都已经置身于AIGC这场迅猛发展的洪流之中。这也是我们在此时推荐本书的初衷。这是一本AIGC入门读物,一本可以让我们真正了解ChatGPT、捕捉下一个引爆点生成式AI的书籍。
ChatGPT、OpenAI、生成式AI、人工智能、Web3.0、聊天机器人、搜索工具、文本创造工具、AI绘画、Stable Diffusion、Midjourney,如果你想更深刻地了解这些日益见诸于新闻的技术术语,本书将是一个很好的开始。
本书的作者之一杜雨为中国社会科学院大学技术经济学博士研究生,先后就职于腾讯、红杉资本,长期关注数字经济与科技创新;作者张孜铭为北京大学管理学硕士,新加坡国立大学金融工程硕士。元宇宙教育实验室智库专家,两人合著有《WEB3.0:赋能数字经济新时代》。
2022年,Web3.0 受到前所未有的关注和讨论,杜雨和张孜铭二人适时推出《WEB3.0 :赋能数字经济新时代》一书,帮助大众打开这一重要趋势的认知大门。和那本书一样,《AIGC:智能创作时代》也用浅显的语言为我们详细介绍了有关AIGC方方面面的重要话题,以便我们更好地了解并把握AIGC给各行各业带来的机遇和挑战。
经我们的努力,中译出版社特别为我们的读者提供了35本作者签名版《AIGC:智能创作时代》,今天我们也一本不留全拿出来,回馈一直支持我们公众号的粉丝,前35名下单读者即可拥有签名版《AIGC智能创作时代》,数量有限,只有35本,先到先得哦!
老牛精选
《AIGC:智能创作时代》
杜雨 张孜铭著
中译出版社
温馨提示:扫码添加下方客服小哞微信,咨询商品和订单详情。推品推荐、商务合作,请添加Zoe微信。下单扫码添加“老牛的每周推送”可随时随地了解订单状态,让您做到购物全程无忧。
▼▼▼
微信扫码关注该文公众号作者