Redian新闻
>
国内首个视频垂直大模型发布!一句话生成科幻大片预告,人人可玩

国内首个视频垂直大模型发布!一句话生成科幻大片预告,人人可玩

公众号新闻
明敏 发自 凹非寺
量子位 | 公众号 QbitAI

只靠一句话,AI就能做一支科幻电影预告片。

脚本、每帧画面、背景音乐,AI都能生成。

这就是国内首款视频垂直大模型新壹视频大模型带来的现场首秀。

由该模型作为底座的AIGC视频平台一帧秒创,同步推出,现在可直接体验。

不仅是用AI生成画面,这个平台还能实现图文转视频、AI帮写、插入数字人等。

在过去半年试运营中,该平台每天产出超出10万分钟视频,积累了200多万用户。

同时还推出了数字人创作平台,24小时内就可以训练好一个数字人。

在发布现场,还有投资人任泉还来帮忙站台,强调正在视频领域发生的新技术革新。

所以,这个视频大模型什么来头?

首个垂直视频大模型?

发布会介绍,新壹大模型是一个以视频为核心的多模态AIGC模型。

通过对海量视频样本的学习,具有几大关键能力:

  • 多模态感知

  • 实时学习

  • 自迭代

  • 多场景交叉推理

由此它能理解文字的含义、识别图像内容、感知音乐情绪,然后生成视频。

在发布会现场的演示中,最开始给新壹大模型的仅仅是一句主题:

人类驾驶地球、离开太阳系、并遇到危险。

然后就看到大模型很快理解了意思,输出了10个镜头的脚本,都非常契合主题。

下一步,再基于生成文字内容,大模型又给出了10个分镜头。

从现场效果里可以看出,每一个镜头给出的画面,和文字的对应也很紧密。

比如镜头八的脚本是“一位科学家站起来,他的眼神坚定”。

画面上就给出了一位穿太空服的男性,皱紧眉头,眼神坚定。

再要求AI配一段“大气磅礴、有重低音和交响乐团的元素,给我一种踏上新征程的感觉”。

最后把生成的所有素材一结合,就有了一个完整的科幻预告片。

据介绍,新壹视频大模型采用了自监督学习方案,会观察和学习大量的视频数据,通过分析视频的结构、内容、风格等多个维度,自我理解和把握视频制作的规则和逻辑。

而且能跨场景进行知识迁移与关联,选择合适素材,调整视频风格;还可面向行业级的垂直场景对新壹视频大模型做定向训练

在现场,新壹方面也强调,大模型中关于视频理解、匹配输出的部分,均是由自研技术支撑

而以该模型为底座的座的AI内容生成平台一帧秒创,也正式发布。

它能提供图片生成、视频生成、声音生成、数字人生成等任务。

并提供了一个千万级的结构化视频库,可以精准匹配素材。

比如在现场演示中,通过平台制作一个“夏日防暑小妙招”的视频,同样是AI自己生成文案、匹配素材。

除了视频制作方面,同步亮相的还有一个数字人平台

据介绍,通过多模态合成AI技术,该平台可以将真人录制的视频和音频素材,快速生成2D写实数字人。

基于新壹视频大模型, 24内小时即可完成一个数字人的训练。通过融合通用语言模型、音视频生成技术,能够快速、低成本的生成真人播报视频和直播。

结合该技术,还有一个名为“秒祝”的明星数字人祝福视频制作产品发布。它可以还原明星的声音和形象,制作出对应数字人,并生成个性化定制祝福视频。

那么问题来了:

带来这一系列AIGC领域新动向的玩家,到底是谁?

视频行业20年老玩家出手

如上一系列新技术、新产品的幕后玩家,名叫新壹科技

公开信息显示,新壹科技注册于2022年1月,是一家非常年轻的创业公司。

但是他们的团队,其实是在视频行业中摸爬滚打20多年的老玩家,曾多次站在视频风口浪尖:如此前大火的秒拍、小咖秀,都是该团队推出的产品。更早之前,则是中国首个上市的视频公司酷六网

新壹科技创始人、董事长为韩坤,CEO为雷涛。

新壹科技创始人、董事长韩坤

这一次召开发布会,用新壹自己的话来解释,就是要在AIGC的时代下,重新出发。

那么,为什么要做大模型?

有直接需求、行业影响和新壹自身三方面要素。

首先是用户需求方面。

作为视频行业的资深玩家,新壹注意到在社交平台极度发达的今天,很多人都有输出自己观点的需要。以及目前人们上网浏览的大部分信息都是视频模式,但是互联网信息中转换为视频的部分,占比却并不多。

所以,一个低门槛的视频创作平台,是有巨大市场需求的。

新壹科技CEO雷涛举例说,比如很多人对于一些事情都想发表观点,但是他可能不愿意或者没有时间自己出镜,这时如果他有一个数字人可以帮他出镜,再有工具能快速剪辑视频,就能很好满足这部分人需求。

这也是新壹反复强调的一个点:AIGC时代下有技术是不够的,还要能提供直接使用的场景,这样技术才能被更高频率、更大范围地应用起来,而在这方面,垂直领域玩家具有先天的自身优势——本身就更懂市场需求。

其次是行业方面。

作为经历了互联网视频产业崛起的玩家,雷涛认为目前产业内的各方面要素已发展相对成熟,如手机硬件、软件、网络等,都能很好支撑互联网视频产业。

在这样的前提下,AIGC相关的项目是很容易做成的,“只要人工智能可以起来就够了”。

作为一直都有技术积累的视频玩家来说,在这方面就会具备一定优势。

这也是新壹为什么做大模型的第三点原因——自身积累。

基于过去在行业内的20年积累,新壹在视频方面积累了深厚的技术和经验。新壹董事长韩坤发布会上也非常自豪地表示,“我们培养出了一支代码技术过硬的工程师团队,形成了良好的产品服务意识。”

同时雷涛表示,新壹做大模型,并不是重复造轮子。他们的技术底座中,视频方面主要依靠自研,但是在图像、TTS等领域,也会集成业内的优秀成果。

我们是用另一种方式提供工程化的创新。就好比造车一样。

新壹科技CEO雷涛

但现在就已经是AIGC产品应用开发的最佳时机了吗?新壹为何在这样一个时间点正式对外推出?

雷涛也从技术和行业两个方面给出了解释。

技术上,他认为AI领域的各种创新,不会存在一个所谓的成熟期,技术一直在不断迭代优化。新壹从现在出发,之后也会不断在技术上进行迭代。

再结合行业现状,AIGC热潮如今略有降温,但雷涛认为这并不是一件坏事。因为只是看热闹的人已经走了,剩下的则是对AIGC有真正需求的人,而这部分人现在对AI的胃口已经被吊起来了。

所以在这个时间节点下,他们对外发布新壹视频大模型,并带来一帧秒创制作平台。

值得一提的是,在发布大模型相关产品的同时,他们还推出了一个数字人平台。

要知道,数字人技术热潮比AIGC更早,赛道内的玩家数量众多,新玩家新壹并不具有先发优势。

雷涛解释说,基于新壹自身在视频、娱乐产业方面的积累,他们看到在这方面其实有非常明确的商业模式,比如给明星制作数字人让它帮忙带货。

在发布会现场,不仅是任泉本人来给新壹站台,还有多位明星送来了祝福视频。

并且新壹使用了更加先进的技术,价格也不高(售价可低至千元价位),所以现在加入数字人赛道,新壹同样有自身独特优势。作为这种技术成本和应用的能力,新壹还宣布了与新浪微博的合作,将为金V用户提供专门数字人。

实际上,在秒拍和一直播风靡的周期里,与新浪微博也始终密切相关。

但关于新壹科技的投融资,还尚未到对外官宣的时候,不过CEO雷涛透露,进度各方面都比较顺利,不少投资人也看到了AIGC正在对视频领域展开的技术革新,而新壹这支团队穿越多个周期、潮起潮落、久经考验。

有意思的是,这其实也是韩坤雷涛这支视频老兵团队时隔多年的再度公开亮相,但地点都是北京东三环的康德莱酒店。

上一次,2017年在这里,秒拍一直播母公司一下科技宣布了新一轮巨额融资,震动江湖。

这一次,韩坤站在台上,表达着一直站在创业路上的原因——对视频内容的热爱,而新壹则是这种热爱的延续和新的开始。

“新的开始,壹定成功。”

「AIGC时代的算力基石」沙龙筹备中

8月9日,量子位将在北京线下举办行业沙龙「AIGC时代的算力基石」,诚邀算力产业相关企业报名参与~ 

点击图片了解招募详情,企业报名可联系活动负责人微信iris_wang17,备注企业-姓名。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
今天,国内首个数学千亿大模型 MathGPT 上线开启公测4个月狂揽两千万,国内首个披露营收的大模型来了!给大模型生成文本发身份证:针对大模型生成文本的可编码水印技术国内首个网文大模型来了!「阅文妙笔」:我最懂网文索赔1元的“大模型数据被盗第一案”和解;首个生成式AI监管文件正式施行;雷军:小爱同学已升级大模型丨AI周报5.29.23 月光照在河面上视频版Midjourney又进化了:一句话生成视频,谷歌注资,网友大呼好莱坞已死!深圳内推 | 粤港澳大湾区数字经济研究院招聘垂直大模型算法实习生对话科幻大咖丨沃尔索:第一次接触中国科幻小说,像发现了新大陆美图大模型发布!一口气上新7款产品,股价暴涨21.28%360集团彭辉:大模型发展趋势是垂直化!企业级ChatGPT落地只需这4步……第一个吃螃蟹的人!国内首个开放科学倡议发布!网友:什么时候轮到我的领域?中科院出手!1000亿参数全模态大模型发布,能看懂视频、绘画作曲、分析信号三句话生成CPU!中科院ChipGPT攻克AI芯片设计?代码量减少近10倍比科幻更科幻的,是写科幻的作者叫梁启超王小川第三个大模型发布!530亿参数、服务B端、文科更强网飞科幻大片天花板:扎导《月球叛军》曝剧照和海报中国科幻大会元宇宙产业峰会顺利落幕 当红齐天发布九大业态及四大平台一句话生成3D游戏世界!9人开发、AIGC支撑的Roleverse是啥?国内首个开放公测的大模型产品上线,接入通义千问理解与摘要能力 | 新闻1300亿参数,国内首个数学大模型MathGPT上线!多项基准赶超GPT-4解构具有永恒魅力的经典沙拉——华尔道夫沙拉【图文视频】行字念行不念行华为盘古大模型3.0正式发布!一句对话生成代码,还能解决世界难题...淘天成立KA服务部,这将是天猫的“垂直大模型”?比亚迪:预计上半年净利润超百亿;索尼与微软达成协议;携程发布首个旅游行业垂直大模型“携程问道”;腾讯客服回应微信号被回收...阿里100瓶毒药解马斯克难题?国内首个大模型价值对齐数据集开源,15万评测题上线!AI越来越神:7人团队开发,一句话生成3D游戏的MoonlanderAI是啥SolidUI:一句话生成任何图形,版本0.2.0功能介绍预告:JCPenney 送钱了,满 $25 减 $24.99,人人可领大模型刷新教育赛道,网易有道发布国内首个教育大模型“子曰”Eden Might Have MagnoliaMeta音频AI三件套爆火:一句话生成流行音乐&音效,还能高保真压缩音频|开源不期然又遇见当年的自己-:)大模型变“小”:黑马天启开创AI模型“重度垂直”新思路,入选北京大模型行业应用典型案例
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。