Redian新闻
>
3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

公众号新闻
3DGen 发自 凹非寺
量子位 | 公众号 QbitAI

3D生成也有自个儿的人工评测竞技场了~

来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena,和大语言模型的Chatbot-Arena、GenAI-Arena等一脉相承,要让大伙儿对3D生成模型来一场公开、匿名的评测。

3DGen-Arena同样是让两个模型进行比较,分文生3D、图生3D两个赛道。

展示形式上考虑到3D生成的复杂性,3DGen-Arena同时提供3D资产的法线图、无纹理几何图和贴纹理RGB图的360°环绕视频

投票方式很简单,请看VCR:

第一步点击“Sample”选择prompt(共有1000+条),第二步点击“Send”让模型生成,第三步分别从几何合理性、几何精细度、纹理质量、几何-纹理一致性、文本/图像-3D一致性这5个维度上对模型投票,投完票就能看到背后模型的真面目了。

目前场上已有19个开源3D生成模型,其中9个文生3D模型,13个图生3D模型。


除匿名投票外,3DGen-Arena还支持参与者与指定模型进行比较,以及与单个模型交互。

已开赛,来pick

近两年,得益于Diffusion模型在2D领域取得的巨大成功,以及Objaverse系列大规模3D数据集的开源,3D物体生成领域已经进入迅速发展阶段,3D生成模型数量激增。

然鹅,如何科学、公平地评价这些模型成为了领域内公认的难题。

目前已有的3D评测指标大多沿用了2D领域的范式。其中,Clip系列模型表现出的强大图文对齐能力使得基于Clip的方法尤为受欢迎,如Clip-Similarity、Clip R-Precision等。

但由于2D和3D领域间存在不容忽视的域差异(domain gap),这类不具备3D先验知识的2D指标,在实际应用中,常常并不能满足人们的需要。

例如,3D工作者们关心的几何合理性、3D一致性、纹理伪影等等关键问题,2D指标远远无法达到令人满意表征水平。

于是,目前工作中更具可信度的评价大多来自于定性的用户评价(user-study),但缺少一个统一、多样的prompt集,使得不同模型间的user-study并不那么容易对齐。

最近,因大语言模型以及多模态大模型表现出的优异性能,出现了一些基于大模型问答的3D评测体系。但此类依赖黑盒模型的评测系统,可能会引入一些潜在的系统性误差,而且不具备好的可解释性。

3D生成评测是一项不适定问题(ill-posed problem),需要综合考虑几何质量、纹理质量、以及与输入信息的匹配程度。

自动化评测系统的探索面临很多技术难题,但令人振奋的是,语言和图像领域为我们提供了人工评测的新思路。

由此,来自复旦大学和上海AI lab的开发者推出了3DGen-Arena。

为实现多维度、全方位的评估,3DGen-Arena划分出的5个独立维度各有侧重,互为补充:

“几何合理性”是3D模型的基本要求,能够衡量生成模型习得的3D先验水平;

“几何精细度”则是更高层次的要求,是提升生成质量的关键方向;

“纹理质量”直接影响生成的3D资产的视觉效果,视角一致、富有美学的纹理贴图是纹理优化的目标;

“几何-纹理一致性”在现实世界中,常常被忽略。但在生成过程中,我们发现保证一致的贴图并不总是容易的;

“文本/图像-3D一致性”是条件生成方式的内在要求,实现跨模态精准控制是不断追求的目标。

除了匿名模型投票外,3DGen-Arena还允许参与者指定模型进行比较,以及与单个模型交互,满足社区的多样需求。

开发人员表示,考虑到部分文生3D模型漫长的训练时长,以及复杂的数据后处理,目前3DGen-Arena暂不支持开放式输入的在线生成功能。

但他们精心设计了1k+条prompt,其中文生3D和图生3D各500余条,是现有其他评测系统prompt集数量的10倍(~10x),涵盖了“交通工具”、“动物”、“植物”、“食物”、“室内物品”、“室外物品”等6大基础类别。

为了观察3D生成模型对prompt复杂程度的敏感程度,除了单个物体生成外,开发人员还设计了物体间的多种排列组合方式,以及一些带有交互的“微场景”。

截至目前,3DGen-Arena平台已经内嵌了1w+个3D资产,可以提供5.8w组不同的比较对。

开发人员还表示,之后将继续维护和完善3DGen-Arena:增添更多的开源、甚至闭源模型;定期维护、更新排名榜;上线支持开放式输入的在线生成服务……

3D生成为何需要一个科学、全面、鲁棒的评价体系?这当中益处不言而喻。

一方面, 通过质量评测,深入理解现有生成模型的优缺点,挖掘潜在的发展方向,进而指导模型改进和新算法的开发,不断探索AIGC的能力边界。

另一方面,多维度的3D质量评测对实践应用有指导性作用, 便于针对不同的下游需求,把握关键维度,权衡次要维度。

话不多说了,从事3D生成的或者对3D生成任务感兴趣的家人们,快去pick你喜欢的模型吧~

https://huggingface.co/spaces/ZhangYuhan/3DGen-Arena

—  —


投稿请发邮件到:

[email protected]

标题注明【投稿】,告诉我们:

你是谁,从哪来,投稿内容

附上论文/项目主页链接,以及联系方式哦

我们会(尽量)及时回复你


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
《春姑娘》&《枕着光的她》众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸奥运遗产的中法对话:从竞技场到可持续发展|财经看奥运王炸开场,世界最强模型重回OpenAI几千块的耳机不香了!不入耳,无感佩戴,3D环绕音质,还得是美国魔声!English Five Days从莫言说他的母亲想到的~Meta 推出文生 3D 模型「重磅炸弹」,一秒生成逼真 3D 素材国家最高科学技术奖获得者薛其坤:披荆斩棘叱咤量子竞技场Meta发布3D Gen AI模型,可在1分钟内生成高质量3D内容;马斯克称特斯拉将消灭所有空头:比尔盖茨也不例外....3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D00后清北学霸团队打造,3D生成模型,爆火海外WizardLM新作!ArenaLearning: 通过模拟LLM竞技场来构建大规模数据飞轮回国杂记(2403)难忘农垦中学那些人和事个人感慨之126 谁是傻子?编码数学击败GPT4-Turbo!DeepSeek-Coder-v2登顶竞技场最强开源编码模型开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线国家安全部:太空不是相互博弈的竞技场国产黑马大模型盲测竞技场挺进全球前十!中文榜和GPT-4o并列第一大模型到底哪家强?达摩院推出“全自动竞技场Auto Arena”评测框架1分钟生成高质量3D素材!Meta甩出文生3D模型,效果演示惊艳无需3D数据也能训练,港科&港中文联手华为推出3D自动驾驶场景生成模型OpenAI再压谷歌一头,最强模型GPT-4o免费发布,语言对话媲美人类反应黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10复旦发布公开匿名评测平台:3D生成模型同台竞技,魁首究竟花落谁家!高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF知名学者与顶级投资人领衔!视频、3D、音乐生成玩家都来了,中国生成式AI大会嘉宾阵容更新,4月开启!首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次大模型盲测竞技场放榜!国产黑马冲进世界七强,中文并列第一DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩VAST宋亚宸:3D生成迈入秒级时代,今年将做到Midjourney V5/V6水平丨GenAICon 2024直播预约|对话VAST宋亚宸:聊聊3D生成「通用大模型」时代5秒完成3D生成,真香合成数据集已开源,上交港中文新框架超越Instant3D60秒直出3D内容,纹理逼真!Meta最新3D Gen模型实现60倍速生成神笔马良画出三维世界,基于线稿的3D生成编辑方法SketchDream来了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。