Redian新闻
>
AI开始为数字人注入灵魂

AI开始为数字人注入灵魂

公众号新闻


作者:弗雷迪

来源:格隆汇APP(ID:hkguruclub)


这几天,国内“冷门歌手”凭借AI翻唱再度走红。

B站网友用AI模型生成了歌手孙燕姿的AI分身,其实跟车载导航上的“林志玲”、“郭德纲”类似。拿歌手本人的音频去训练,生成一个音色一模一样的“孙燕姿”。

然后,让偶像唱自己喜欢的歌的心愿,就以这样一种诡异的方式实现了。

图源:B站


海外的玩法更加离谱。

美国一个拥有180万粉丝的23岁女网红,通过用GPT-4复刻了自己的AI分身,然后同时与1000多个网友谈恋爱,每分钟收费1美元。

仅一周,她就狂赚了7.16万美元。

并且还远不止如此,现在她的“男友”还在急速增加中,目前已经增加到了近万人,排队等待与她“谈恋爱”时间已经长达96小时。

有分析认为,按照趋势,她月入500万美元没有任何难度,如果不是技术限制,她赚到的钱,将可能是一个天文数字。

这些现象已经可以充分说明,一个由AI+带来的新技术红利时代,正在被急速到来。


PART.1

数字人军团涌入直播间



直播带货是虚拟IP变现最具潜力的场景。

Z世代对社交、视频、网购等工具的使用深度遥遥领先于全网平均水平,数字人和虚拟空间结合的新玩法给他们带来了体验感和交互性,虚拟IP的核心粉丝大多来自18-24岁的年轻群体。

这一趋势让品牌方看到了让产品打破圈层的机会。

2020年,虚拟歌手洛天依和乐正绫等来到淘宝直播间,为博士伦、美的、欧舒丹等品牌带货。这场直播观看人数高达270万,有近200万人打赏互动。

这在当时一度掀起巨大的讨论,虚拟数字人直播的时代已经来了。

而随着今年由chatGPT掀起的人工智能大模型热潮,虚拟数字人领域又迎来一轮更加磅礴的爆发。

一大批量的虚拟数字人开始扎堆涌进直播间。

今年4月份,天娱数科旗下的虚拟数字人“朏朏”已完成 ChatGPT 模型接入,并完成直播首秀,不仅能够实时响应顾客的提问,还能根据不同问题进行自主回答。

图源:抖音


在短视频上,出现过很多这样的场景:一家公司的整个办公室里空无一人,只有一排排办公桌上有数十台电脑屏幕里的AI美女们正在直播......

图源:短视频


这家公司,只靠2D超写实的虚拟形象,提前准备好的话术和背景,就可以直播一天,虽然单个效果不如真人直播,但成本低到令人发指,而且还可以超低成本复制,胜在以量取胜,真正是做到躺着让AI挣钱也并非不可能。

这一切,在说明,一场基于“AI+”的内容效率革命,正在数字人领域爆发。

虚拟数字人根据制作技术、应用场景、形象特点分为很多种。

与3D人气偶像不同,现在大多数直播间里说话的根据真人原型复刻声音、表情的2D写实数字人,你根本分辨不出是真是假,但制作成本远低于勇闯娱乐圈的A-Soul IP们。

一个虚拟主播可以进行7*24全天候的直播工作,随叫随到,也不用担心人设翻车的问题,减少了直播运营中的人工成本。

这背后,是AIGC在重新塑造数字人的生产流程。

2D数字人的制作用上了深度学习,只需要确定形象设计,图文音频数据经过采集、预处理后上传到模型训练,制作方式相对3D更简单,更标准化,制作效能不断提升。

这种工厂流水线的方式,使数字人的制作门槛、成本和周期得到了大幅缩短。

同时,随着行业制作端的技术迭代和成本骤降,针对小型客户的数字人解决方案也开始涌现。

在4月份,腾讯云发布的数字人生产平台,需要生成真人形象的数字分身可以在平台上采购服务,只需上传图像音视频即可实现定制,根据不同音色、视频时长收费。

除了制作数字人,还可以提供整套数字人直播解决方案,功能包括了真人音频接管直播间,获取用户评论智能回复,定价仅需要千元级别。

而有些渠道商,打包售卖AI主播的定价甚至只要200元以内。

这些主播形象大多来自模特经纪公司的授权,投放质量虽然粗糙,抠图痕迹明显,声音也没有特点。

但对普通的中小企业来说,没有大V带货,花不起上百万定制高端IP,想要压缩运营成本, 快速起量,几千块的数字人已经够香了。

数字人直播间,硅基


企业如果想要自己修改代码,产出不同的数字人,还可以向技术提供商购买源码,售价要比直接买AI主播更贵,不仅能自用,还可以使用源码发展代理,甚至比自己做数字人直播还赚钱。

但AI数字人的故事,还没有讲完。


PART.2

AI注入灵魂



IDC在《中国AI数字人市场现状与机会分析》报告中将数字人分为五个等级,目前数字人发展经历从手工制作到AI建模的阶段,初步具备人的外形,但还只能做简单的交互决策。

当智能化水平来到L4、L5级别时,AI驱动的数字人能够接管大多数场景决策,支持更多模态的实时交互,类似钢铁侠的私人AI管家“贾维斯”。

虚拟数字人过去三十年的发展,技术发展和市场需求基本围绕着两点在演变,一是视觉效果;二是交互体验。

虚拟数字人最早出现在游戏、动漫、电影里,对新潮事物的情感连接和IP价值的延伸遥相呼应。

早期的角色型IP使用手绘,动作要一张一张地画。1982年,日本动画《超时空要塞》的女主角林明美成为了首个发行音乐专辑的虚拟歌手。

初代歌姬林明美


在电影里,形象可以用计算机建模,但动作还得让人来做,CG技术和动作捕捉等技术逐渐普及,依靠绿幕,捕捉设备,演员可以成为任何角色。

千禧年后,从02年的《指环王》到去年的《阿凡达2》,角色的渲染效果已经细致入微,为艺术创作带来了巨大便利。

《指环王》中“咕噜”的形象由真人捕捉


到这里,数字人技术的发展围绕更像“人”的极限一步步逼近,不仅仅要求外观、服装上的视觉效果趋近真实,还包括驱动(呈现真实细腻的表情和动作)和渲染(让画面更加精细实时)。

不过,总觉得还是缺了点什么。

1970 年,日本机器人专家森昌弘提出“恐怖谷”理论,由于机器人与人类在外表、动作上相似,所以人类会对机器人产生正面的情感。

当机器人与人类的相似程度达到一个特定程度的时候,一点点的差别都会被放大,并带来负面和反感情绪。而当机器人与人类的相似度继续上升,人类对其情感会再度回到正面。

与电影不同,社交属性更强的应用场景对数字人实时交互的要求更高,不只是满足于制作一个好看的“花瓶”而已。

在交互方面,自然语言模型填补了这一空缺。

文本生成能力已经惊艳众人的GPT,给数字人的“智商”加上了两道杠。

NLP大模型是AI驱动虚拟人的技术基石,简单来讲就是让虚拟数字人能说会道,减少标准化内容的制作成本,被训练来担任智能客服、主持人、导游等角色。长期来看,随着个性化和情感理解的能力提高,为老人提供陪伴关怀,成为小孩子的”私人教师“也将实现。

此外,嘴型动作也可以由AI驱动,建立起与文本的映射关系,随着写实程度的提高,微表情也就更丰富,说话的时候表情、口型能够对得上,这样的数字人不仅“形似人”,而且“神似人”。

新华社:全球首位数字航天员:小诤


Midjourney是基于diffusion model扩散模型的爆款产品,在去年7月发布,通过文本输入指令训练AI绘画。

一对情侣,由Midjourney制图


有机构测算过,目前其年收入就已经能够达到1亿美元的规模。

有B站up主用Midjourney复原了奶奶的写实形象,从外观上看,衰老的皮纹和白头发细节感十足,加上过去的音频重现奶奶的声音,最后通过D-ID生成了奶奶的数字分身。

为了弥补未与奶奶好好告别的小遗憾,孙子和眼前的数字“奶奶”开启了对话,而“奶奶”亲切地回应,其实是ChatGPT提供的回答素材。

图源:B站


正是通过这些用户端的越来越多的尝试,反过来为AI的“人格化”不断添加海量训练素材,加速丰富AI模型数据,最终让AI为数字人注入灵魂,带来更大可能。


PART.3

尾声



对虚拟分身的探索至今持续了三十余年,从手绘到真人驱动,再到AI驱动,拟真感和交互性的体验进步打开了广阔的应用场景,涓流汇成大海。

AIGC帮助将普通人的外观、声音等特征全面数字化,更低的制作门槛打开了市场的想象空间。

IDC预计,到2026年中国AI数字人市场规模将达到102.4亿元人民币,但能够给我们带来多么良好的体验,决定了数字人最终的命运。

同时,AI数字人具备下一代人机交互入口的潜质,未来我们面对的或不再是冰冷的屏幕,而是生动活泼的数字人类,越能够挖掘最深层次的情感需求,成为我们生活里的参与者。

或许正如AI教父所言,人类只是智慧演化的过渡阶段,以便创造出数字智能,如今我们终于有一个长得像人类的数字分身,像我们一样说话,以后或许还能像我们一样思考。

本文转载自公众号格隆汇APP,中国领先的全球投资研究平台。全球视野,下注中国。微信号:hkguruclub。

>End
>>>                        
本文转载自“格隆汇APP”,原标题《AI开始为数字人注入灵魂》。
为分享前沿资讯及有价值的观点,太空与网络微信公众号转载此文,并经过编辑。
支持保护知识产权,转载请注明原出处及作者。
部分图片难以找到原始出处,故文中未加以标注,如若侵犯了您的权益,请第一时间联系我们。

HISTORY/往期推荐




迪斯尼传播快乐,美丽星球点亮梦想



商业运载火箭为什么那么难?



混合所有制模式:新型举国体制在商业航天发展中的逻辑演进和实践路径(之一)



混合所有制模式:商业航天领域推进新型举国体制的重要途径



>>>                  

充满激情的新时代,

充满挑战的新疆域,

与踔厉奋发的引领者,

卓尔不群的企业家,

一起开拓,

一起体验,

一起感悟,

共同打造更真品质,

共同实现更高价值,

共同见证商业航天更大的跨越!

——《卫星与网络》,观察,记录,传播,引领。

>>>                                           

·《卫星与网络》特别顾问:王兆耀

·《卫星与网络》编辑委员会

高级顾问:王国玉、刘程、童旭东、相振华、王志义、杨烈

· 《卫星与网络》创始人:刘雨菲

· 《卫星与网络》副社长:袁鸿翼,王俊峰,周磊

·  微信公众号(ID:satnetdy)团队
编辑:艳玲、哈玫,周
主笔记者:李刚、魏兴、张雪松、霍剑、乐瑜刀子、赵栋
策划部:杨艳
视觉总监:董宁
专业摄影:冯小京、宋伟
设计部:顾锰、潘希峎、杨小明
行政部:姜河、林紫
业务部:王锦熙、瑾怡
原创文章转载授权、转载文章侵权、投稿等事宜,请加微信:18600881613
商务合作;展览展厅设计、企业VI/CI及室内设计、企业文化建设及品牌推广;企业口碑传播及整体营销传播等,请加微信:13811260603
杂志订阅,请加微信:wangxiaoyu9960
· 卫星与网络各分部:
成都分部负责人:沈淮
长沙分部负责人:宾鸿浦
西安分部负责人:郭朝晖
青岛分部负责人:江伟
· 卫星与网络总部负责人:农燕
· 会议活动部负责人乔颢益
· 投融资及战略层面合作:刘雨菲
· 本平台签约设计公司:一画开天(北京)文化创意设计有限公司
· 航天加(深圳)股权投资基金管理负责人:杨艳

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
证件照转数字人只需几秒钟,微软实现首个3D扩散模型高质量生成效果,换装改形象一句话搞定 | CVPR 2023无忧周报|Spirit新增五个波士顿直飞航班,麻州最热门的婴儿名字出炉, 20辆电动校车已经开始为波士顿公立学校服务孩子到了中高年级,我开始为了这件事和他斗智斗勇......工资咋变成数字啦?3分钟搞懂数字人民币!科创载体再升级!FTA四大策略为数字产业社区“流量赋能”广联达ESG报告:为数字中国赋能今天,火山语音团队携数字人亮相FORCE原动力大会了开始为免费的东西"埋单"美正式结束疫情“国家紧急状态”;不准歧视"胖子"纽约要出新规。未来数字人可能免费?人人都需要数字分身几百块用一个月的数字人,能抢走带货主播的饭碗吗?数字化企业如何占领未来发展制高点?DTDS 全球数字人才发展峰会为您揭秘 | 极客时间企业版招聘 | 蚂蚁集团-NLP-大模型/深度学习/数字人算法-3个岗位-社招怎样找到与你灵魂契合的另一半?测测你想要的“灵魂伴侣”是什么样子文革中上海的五七干校Just When You Thought You Were Having a Poopy Day用AI数字人拍抖音,可行吗?全世界应该开始为俄罗斯的崩溃做准备空巢日记摘要(1)事关货币金银!央行召开重磅会议:今年稳妥推进数字人民币研发试点发力推广数字人民币!这一省农信社新目标明确:争当数字人民币全国标杆Origins指定单品及超值装7.5折+满送榆绿木抗老大礼包!入灵芝焕能超值装!里斯本商业广场(Commerce Square),城市地标快速落地基于“AIGC+数字人”的数字化内容生产“只工作,不上班”的年轻人,正在成为数字游民我按宝宝双肩、老公按下半身,医生开始从肛门注入空气“数字人民币”上线一年多,仍然有人不知道它是什么...为虚拟制作注入灵魂,未来电影人的必备神器姓名里的生僻字,让我成为数字时代的「隐形人」“数实”同频回暖 数字技术为源头产业带注入新动能美国大学申请规划:几年级开始为孩子做规划赢在起跑线?数字人民币反诈那些事给数字人注入“灵魂”,360探索大模型“心病”数字人民币发工资十月德东四城~柏林科大讯飞招聘:校招与社招全职,大模型/NLP/计算机视觉/3D数字人等方向
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。