Redian新闻
>
Sora超逼真视频引恐慌!Nature刊文警示AI视频模型,或在2024年颠覆科学和社会

Sora超逼真视频引恐慌!Nature刊文警示AI视频模型,或在2024年颠覆科学和社会

公众号新闻



  新智元报道  

编辑:LRS
【新智元导读】王炸Sora发布后,想要分辨AI视频和真实视频变得更难了,各行各业都面临新的挑战与危机。


技术的发展总是伴随着被滥用的风险,从ChatGPT到最近发布的文本转视频工具Sora,AI生成的内容越是逼真,被滥用的风险也就越高。


仅仅一年前,大家还在嘲笑AI生成的「威尔史密斯吃意大利面」不自然,手部、嘴部、面条没有一个真实的;但现在的顶级AI模型已经可以生成「录像级」的视频了,达到了以假乱真的水平。


无论是普通用户还是专业的研究人员,大多对AI的发展速度感到「震惊」,除了兴奋外,大家也开始担心生成的假视频可能会危及2024年的全球政治,或是颠覆内容创作领域。


最近,Nature上的一篇新闻文章总结了Sora等文本转视频工具对当下的「科学和社会」可能产生的影响,也是继deepfake换脸后,大众又要面临的「分辨假视频」考验,而且这次的考验更加严峻,连可供参考的原始视频都没有。


英国莱斯特德蒙福特大学的数字文化专家Tracy Harwood认为,错误信息是AI模型要面临的主要挑战,「我们很快就会被淹没在大量看似真实的信息中」。


Sora带来社会恐惧


2月16日,OpenAI的Sora模型横空出世,用户只需要通过几个简短的文本提示就能创建逼真的视频,比如「一个女人在东京一条灯光明亮的街道上行走」。


Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.


虽然此前也有类似的模型,如Runway发布的Gen-2,或是谷歌开发的Lumiere,但这些工具并没有引起公众的关注:模型呈现给出的内容非常普通,并且需要非常具体的提示才能让模型生成令人满意的作品。


相比之下,Sora提高了作品的质量,还拉低了AI作品的制作门槛。


与此同时,Sora也给即将到来的英国大选和11月的美国总统选举带来了新的问题,英国阅读大学研究人工智能和电影制作的Dominic Lees表示,届时将会有大量的假视频和假音频流传出来,影响公众的判断。


2023年10月,英国工党领袖Keir Starmer的假音频被公开,今年1月,美国总统拜登鼓励民主党人不要投票的假音频也被流传出来。



目前可用的一种解决方案是要求文本到视频的AI使用水印,可以是视频中可见标记的形式,或是添加在视频元数据中的人工签名,但Dominic Lees对这种措施的有效性仍然保持怀疑:水印可以被删掉,元数据签名需要用户特意查看视频的真实性才行,要求世界各地的观众在观看每个视频时都查看元数据是不切实际的。


Sora也同样影响到了影视创业行业,好莱坞演员、电影制片人和工作室老板Tyler Perry在目睹了 Sora 的能力之后,迅速中止了12 个摄影棚的设计和建造等一系列的影视工作室扩建计划。


Perry还表示,包括演员、场务、电工、交通协调、音效师和剪辑师这些行业人士都将受到影响,Sora 将触及影视行业的每一个角落。


美国演员汤姆·汉克斯去年也表示,人工智能可以让他在死后继续出现在电影中,但如果你是一个雄心勃勃的年轻演员,在争取机会的同时,却被告知「对不起,汤姆汉克斯总是会扮演主角」,你会期待这样的影视未来吗?



文本到视频的人工智能将会为社会带来更广泛的问题。


Harwood认为,我们必须学会重新评估看到的内容,这些文本转视频工具让每个人都有机会成为媒体内容创作者,我们需要处理由此产生的后果,也代表着作品消费方式的根本转变。


AI对社会的益处


不过AI技术也对社会的发展存在益处,Harwood认为文本转视频技术可以被用来「以一种更容易理解的格式」呈现较难理解的文本,比如把学术论文可视化等。


Harwood表示,文本转视频模型可以用来做的最重要的事情之一就是「向外行观众传达专业的研究结果」,其能够将相当复杂的概念进行可视化。


另一个潜在的用途可能是在医疗保健领域,文本转视频AI能够代替人类医生与患者交谈,但英国科学传播顾问Claire Malone认为:虽然有些人可能会觉得这项技术不够靠谱,但在用过之后,他们可能会发现如果他们想多次向医疗专业人士提问,就会非常方便。


Malone也认为,文本转视频的AI模型可以帮助研究人员获取海量数据,如由欧洲粒子物理实验室欧洲核子研究中心在瑞士日内瓦附近和其他大型科学项目产生的数据集。


生成式AI可以完成一些普通的研究任务,如对代码进行筛选等;也可以做更复杂的工作,例如输入数据并要求模型做出预测。


参考资料:
https://www.nature.com/articles/d41586-024-00661-0



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
《丝路之约》&《牧马城市》国产多模态大模型狂飙!颜水成挂帅开源Vitron,破解图像/视频模型割裂问题逛台北的年货大街(多图)一锤降维!解密OpenAI超级视频模型Sora技术报告,虚拟世界涌现了人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora「懂物理」是具身智能核心!北大高逼真物理仿真,加持磁性微米级机器人登Nature子刊剪辑软件Pr要用第三方AI视频模型了!我能学会吗?固定收益 | 从编写大纲看PPP特许经营要点——评《政府和社会资本合作项目特许经营方案编写大纲(2024年试行版)》硅谷恐慌:Open AI发布全新视频模型Sora!现实,不存在了AGI 加速降临!人大系多模态模型首次实现自主更新,写真视频生成力压 Sora全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT上网联2023社会责任和社会公益优秀案例颁奖仪式在沪举行【七律】銀婚贈友人【求职战报】全球金融交易平台Deutsche Börse Systems销售运营面试邀约!ChatGPT如何「思考」?心理学和神经科学破解AI大模型,Nature发文Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂周鸿祎谈视频模型Sora;胖东来回应员工悄悄尝面;极兔快递股价跳水;支付宝:6亿人次参与AI年俗...进度赶超大厂,中国最接近Sora的视频模型出自一家「清华系」公司|New Things超越Sora极限,120秒超长AI视频模型诞生!澳洲多起袭击事件引发社会恐慌!艾博年:坚决守护多元文化,悉尼墨尔本生活和谐恐怖谷!哥大华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真万兴科技朱伟:Sora至今没有商业化,视频模型成熟需要周期丨GenAICon 2024AI早知道|字节跳动推出超高清文生视频模型;SVD的Web平台发放测试资格;苹果计划收购 Brighter AI逆天 美国华裔学生开发人脸机器人 表情超逼真二次元版Midjourney重磅升级V6!动漫风人物超逼真生成,网友上手效果令人疯狂AI早知道|谷歌推出文生视频模型Veo;百度发布全球首个支持 L4 级自动驾驶的大模型我特别想收养这个孩子ChatGPT大范围出现幻觉;传谷歌视频模型负责人加入字节;OpenAI工程师曝工作时间表丨AIGC大事日报一张照片+音频=超逼真数字人视频!VASA-1模型拉开「实时交互」大幕谷歌放大招,AI搜索引擎来了,发布最强AI模型!发布会现场:总共提了120次AI、视频模型登场......《扫花游 - 听雪》洛杉矶18车30分钟内遭破窗,无一警报响起!新技术犯罪引恐慌...外企社招丨Dräger德尔格,行业全球领导者,15薪,六险一金,多样福利,偏爱留学生鲨鱼“旺季”已到来,攻击人引恐慌!专家警告:远离悉尼港终局之战!OpenAI Sora大佬专访:AI视频模型仍处在GPT-1时代
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。