大模型真能变现！这批打工人，干着大厂的活，赚着副业的钱

科技

2023-04-21 08:04

新智元报道

编辑：编辑部

【新智元导读】现在，已经有互联网大厂打工人用类GPT模型赚到钱了！

当你还在和ChatGPT尬聊时，已经有人用它搞到钱了。

前段时间，国外网友给ChatGPT 100美元自创业，搭建网址、内容策划、传播全都AI搞定，甚至LOGO都是由Dall-E设计的。

公司运作2天，估值飙升到25000美元。看到ChatGPT的羊毛这么容易薅，网友也纷纷按捺不住了。

其实，还有另一个用「ChatGPT」赚钱的门道，而国内已经有开发者，用ta赚到了第一桶金。

一次偶然经历，诞生一个项目

此前，无空从未能想到，一次在家「休假」的机会，竟然让自己做起了一个项目。

当时，被困家中的无空，和朋友一起报名参加了当地的志愿者。

而在服务中，他了解到，面对重大突发事件，基层管理中存在不少难题。

基层治理的困境之一，是人少事多。

比如在上海，一个街道/镇下属的居委会总共只有5-9个人，但需要对接3500-5000名居民，平均每个人要对接400-500人。

以上数据来自公众号「上海大调研」（中共上海市委网络安全和信息化领导小组）

另一个困境，就是力小任大。基层人员素质不能保证，有的刚刚上手小白无法一时胜任工作任务。

因此，不少小区的管理运行陷入了困境，遇到极大挑战。

此时，无空和同伴萌生出一个想法：能否打造一个线上IT志愿者团队，也就是AI助理，来协助封控小区的基层管理呢？

说干就干，一个名叫「临小助」的数字社工助理火速诞生了。

值得一提的是，这些来自微软、百度等大厂的项目成员，在兼职的时间就把钱赚了。

「临小助」不仅能解答居民的提问，还能给社工做培训。

下面这个198个业务指导文档，可以说是基层工作者的噩梦了。

以往，他们只能死记硬背，苦不堪言。效率低不说，需要用的时候也未必能想得起来，或者根本找不到。

而临小助这个深度学习模型，就完全可以替代人脑的死记硬背，通过CUI对话式界面提供使用入口，犹如给基层人员增加了一个永不疲倦、永不失忆的「外脑」。

甚至，AIGC技术驱动的「数字人演员」，还能以「互动剧」的形式，和工作人员进行「对手训练」。

课程内容可搭载于基础的「数字人」系统（微信端 or IP端），也可以视频游戏、全沉浸式培训站的形式呈现。

那么，「临小助」的这些能力的实现就是用到了大模型「源1.0」的能力，主要体现在两个方面。

一是，使用了「源1.0」生产了许多数据去训练「临小助」模型。

因为模型在实际训练过程中，需要街道社工去采集真实用户的语料，然而这些语料是远远不够的。

因此，研发团队就让「源1.0」按照实际采集的语料做仿写，进而扩充语料。

另一方面，就是「临小助」的模拟居民和社工情景对话的功能，也是离不开「源1.0」加持。

情景对话的过程中，每一句话都是通过「源1.0」实时生成。

项目发起后，已经在上海市静安区临汾路街道和嘉定区安亭镇落地。

今年3月左右，一位静安区临汾路街道的社工才刚刚入职，就遭遇了难题：接待时，遇到了居民询问「如何申请共有产权保障房」。

还是小白的他求助了「临小助」，短短1秒钟，就得到了条理清晰的答案。

其实在「临小助」之前，无空曾基于「源1.0」开发了一个AI剧本杀的项目，并在GitHub上开源。

AI剧本杀：https://github.com/bigbrother666sh/shezhangbujianle

凭借「源1.0」零样本（Zero-Shot）和小样本（Few-Shot）学习的优势，AI模型可以很好地理解并实现交互式叙事的「对话策略」，运用「举一反三」的对话能力。

只要算一下就会发现，「临小助」这个项目的商业前景，可谓十分广阔。

按民政部网站数据，截至2020年底，中国共有38741个街道（镇、乡）级政府，按15%的渗透率计算，基础服务部分市场规模就已高达数亿每年。

动手做个「贾维斯」？

无独有偶，对未来前沿技术感兴趣的另一位开发者郭泽斌，便在想大模型和数字人结合，能够带来什么便利？

以往像Siri的数字助手都是通用的，郭泽斌希望能够一体化构建自己专属的数字人，不仅可以改变形象、音色，还能够在反馈中不断训练。

于是，他开始动手尝试做了一个数字人的项目——数字人Fay控制器，已在GitHub上收获了近1000星。

现在，一家公司基于这个项目做的产品应用，已经上机平板。

还有一家玩具公司已经基于这个技术，做出了与儿童情感交互的玩具，即将上市售卖。

除此之外，郭泽斌还设想了这个数字人其他的用例，比如做网红主播、电子导游、虚拟老师、前台指引等等。

那么这样的数字人该如何实现？

以直播带货为例，当一个粉丝点赞，另一个粉丝同时在骂主播，数字人该如何应对？

这就需要建立行为模型，来学习真实主播的性格。

具体操作就需要，把目标主播的直播录制下来，提取样本数据。

然后再训练一个从粉丝的不同刺激的组合，到主播的不同响应方式的多元逻辑回归的数学模型。

而在训练时用到的语料就包括「源1.0」。

值得一提的是，在中文语料上训练的「源1.0」，在中文的语义理解和识别上，更加准确。

另外，把现有主播性格模型数字化后，无法快速去调整性格特征。这就需要手动调节行为模型参数，而Fay控制器就是发挥这一作用。

数字人核心架构搭好了，就需要一副皮囊。

郭泽斌使用了UE4来作为模型的驱动引擎，人物选择上，可以是超写实的，也可以是二次元的。

这样一来，就可以通过Fay控制器为数字人设定人设、音色，形象，并在反馈中不断训练。

AI大模型时代的「安卓生态」

ChatGPT横空出世，无限放大了人工智能「涌现」能力。

随之而来的是，国内外许多大厂都在探讨要把AI用在哪，如何让这一「涌现」能力真正落地。

OpenAI在商业化前景上做了一个典范，通过开放API接口先行一步。

大模型能力不断跃迁，代表着AI大规模商业化时代的到来。

在OpenAI之外，是否可以让大模型像安卓系统一样，让开发者基于模型做各种APP，进而带来商业价值。

也就是说未来大模型商业化落地方向，可以将大模型作为基础设施，让开发者释放出价值。

从上面案例可以看到，开发者通过将「源1.0」与数字人相结合，由此实现了商业价值。

那么，大模型「源1.0」是一个怎样的存在呢？

2021年9月，浪潮发布了「源1.0」单体巨量自然语言处理模型。

在发布之初，就问鼎了全球最大规模的中文AI模型，其参数规模高达惊人的2457亿，而训练时采用的中文数据集的体量达到了5000GB。

相比于GPT-3的1750亿参数量和570GB的训练数据集，「源1.0」在参数规模方面碾压了GPT-3约40%，训练数据集规模领先近10倍。

「源1.0」地址：https://air.inspur.com/

但「源1.0」可不是「虚胖」。

刚一发布，就摘得了中文语言理解评测基准CLUE榜单的零样本学习和小样本学习的两项总榜冠军，同时登顶该榜单精简榜的榜首，还获得了语言理解（篇章级）、语言生成、对话交互、多语言、数学推理等5项评测最佳成绩。

「源1.0」小样本学习能力极强，能够适应多种类的AI任务。

在实用领域，搭载「源1.0」的智能客服机器人、虚拟数字人、文案撰写工具、智能内容处理等多种不同AI应用都已经和大家见面了。

现在让我们从表面立足，深入到「源1.0」的技术层面一探究竟。

在算法层面，「源1.0」采用Transformer结构，针对Attention层和前馈层的模型空间进行结构优化，改进注意力机制聚焦文章内部联系的学习。

在数据层面，中文训练数据一直存在海量数据难以获取、难以清洗，以及没有统一质量评估标准等等难题。而浪潮自研了针对海量数据的过滤系统（MDFS），建立一套全面的全自动端对端数据工作流程，包括数据采集、粗滤、质量分类、精滤等。

正是靠着MDFS，「源1.0」才成功的把866TB的海量数据清洗成了规模5TB的业界最大规模、最高质量的中文数据集。

在算力效率层面，大模型训练中一直存在计算模式复杂，算力集群性能较低的情况。

而「源1.0」创新地在大规模分布式训练中，采用了张量并行、流水线并行和数据并行的三维并行策略，首次提出面向效率和精度优化的大模型结构协同设计方法，围绕深度学习框架、训练集群IO、通信开展了深入优化。

在仅采用2x200G互联的情况下，「源1.0」的算力效率达到45%，远超MT-NLG与GPT-3等国际知名模型，领先全世界。

「源1.0」大模型实现推理算法创新，研发了可支持多元异构芯片部署的大模型推理软件框架，在400颗国产芯片集群上实现了大模型弹性部署，并将模型的推理性能提高了数10倍，形成大模型+大算力的算法基础设施建设的最佳实践。

现在，让我们再次从技术的深海中探出来，看看具备优秀的自然语言理解和自然语言生成的能力的通用的巨量中文AI模型「源1.0」在下游领域的应用。

首先，「源1.0」支持「预训练+微调」的研发方式，可以用一套技术解决不同场景的NLP任务。这样做的好处是，开发者训练AI的效率大大提升，需要的训练数据量可以减少90%以上，开发周期大大减少，从年缩短到月。

其次，在文本生成方面，「源1.0」同样傲视群雄。

它可以生成各种风格、类型文本，如新闻资讯、金融行研、办公公文、法律文书、广告营销、网络文学、诗词歌赋，甚至连食谱菜谱都可以一键生成。

而从文本质量看，其原创性和连贯性都和人类的工作没有差别。「源1.0」作为一种工具，可以有效推动创作方式的转变，辅助人类创作，甚至完全进行自主创作。

同时，「源1.0」还具备记忆能力，可以扮演多种人物角色。

开源开放，构建大模型应用开发新生态

目前，「源1.0」已上线开放平台，开放模型API、开源高质量中文数据集、模型训练代码、推理代码、应用代码、面向AI芯片的模型移植开发代码。

而这也就是为什么从「源1.0」衍生出了那么多好玩的东西。

就比如，前面提到的首个可以跟人类玩「剧本杀」的AI剧本杀玩家。AI所扮演的角色不仅可以与其他玩家流畅对话，甚至还会「套路」人类玩家。

也正是因为「源1.0」数据集的开源，可以让开发者直接利用开源数据对自己的模型进行二次训练。

其模型训练精度得到了明显提升，训练结果甚至登顶CLUE基准评测榜单。

在其它领域，开发者们也利用「源1.0」搞出了不一样的东西。

最好玩的可能就是心理咨询领域的开发者用「源1.0」开发了一个「闹情绪」、心理状态不佳的求助者角色。而它在交流中表现出各种来自工作、生活、情感及人际关系等烦恼、压力及焦虑情绪等多样化问题。

此时，受训心理咨询师要在指定时间内了解情况、整理焦点、以助下一步跟进服务。

怎么样，神奇吧。

除了这些，还有数字演员、正能量陪伴机器人、抬杠机器人、游戏NPC对话、文案写作、金融文本分析等极具应用价值和创造力的应用。

别的不说，正能量陪伴机器人来几个送家人，抬杠机器人来几个送老板（不是）。

未来，「源1.0」将会应用于智能写作领域，逐渐覆盖公文写作、媒体、金融等行业。

总而言之，依托于「源1.0」进行开发的可能性非常之多。

毕竟，大模型潜力不可估量，未来也是值得每个人去不断挖掘和探索。

想想了解给「源1.0」加上好看皮囊的开发者们成功实现商业价值的背后故事吗？快来参加4月26日「源创空间」线上直播，扫码观看。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章