Redian新闻
>
3D版Midjourney来了?Luma AI发布Genie 1.0,生成手办只需10秒

3D版Midjourney来了?Luma AI发布Genie 1.0,生成手办只需10秒

科技

机器之心报道

机器之心编辑部

文生 3D 模型又来新玩家。


随着生成式 AI 的浪潮席卷而来,科技公司都在冲击 AIGC 的下一个突破口 —— 3D 生成。

目前,文生 3D 在学术界取得了许多新突破。在产业界,无论是像英伟达这样的行业巨头,还是像 Stability AI 这样的中坚力量,都推出了自己的文生 3D 工具。虽然 3D 生成领域一直「卷」到飞起,但是好像一直没有出现一款效果足够惊艳,生成速度足够快的代表性产品。

如今,一直致力于 3D 内容生产的 Luma AI 向这一领域发起了挑战。就在昨天,Luma AI 发布了一个文生 3D 模型的项目 —— Genie 1.0。只需要输入一句文字提示,Genie 1.0 就能在 10 秒内生成四个高保真的 3D 模型。用户可以从中选择,并在三维网格界面内对模型的纹理进行编辑。


这些 AI 生成的 3D 模型可以在屏幕上预览,也可以导出到 Blender、 Unity 等工具中进一步使用,直接加入动画、游戏、VR 等工作流中。

Genie 1.0 不仅有网页版,在 discord 平台和手机端都可以试玩。一经发布,慕名而来的网友们就把 Genie 1.0 冲上了 App Store 下载榜前列。

试用地址:https://lumalabs.ai/genie?view=create


效果有多惊艳,一起来看看。

简单输入提示「flower cat」,再等待几秒,四只身上带有不同花纹图案的猫咪就出现了。想要什么手办,AI 直接送上精美的盲盒版本,一次输入,能抽四次,怎么算都很赚。


泡泡玛特风格这么可爱的手办,也能安排。想要什么隐藏款,AI 版本实现量产。


文生 3D 中的难题,毛发和物体表面的花纹,Genie 1.0 也有令人惊艳的表现。它生成的熊猫能看得到毛茸茸的质感,衣服上的纹样也没有出现明显的失真。


推特 @lintworld

如果《星球大战》出 3D 动画版本,直接使用这只 Genie 1.0 生成的「尤达大师」好像也没什么问题。


推特 @blizaine

和其他 3D 模型对比,Luma AI 的表现在立体度和真实感方面,也能拔得头筹。


推特 @taziku_co

除了生成效果惊艳,Genie 1.0 还有编辑功能。拆掉了原来的专业门槛,告别贴素材,修改 3D 模型的材质可以像用手机 P 图一样简单。

Genie 1.0 提供了「原始」、「光滑」和「反光」三种质感,点击页面右侧的圆形按钮即可切换。还可以按照需要导出不同清晰度和格式的模型,与其他 3D 编辑软件无缝对接。


以往,批量设计 3D 模型往往需要花费数天,虽然目前市面上已经有很多 AIGC 工具把 3D 设计的时间缩短到只需几小时甚至更短。但 Genie 1.0 已经把人们加工的时间压缩到了 2 分钟。

已经有 3D 设计师表示把 Genie 1.0 生成的模型导入 3D 动画软件 Maya,因为 AI 生成的模型质量很高,纹理坐标(UVs)很合适,只有几个小块有重叠,花 2 分钟小调一下,就直接可用,体验一流。


在动画软件中加上几个动作锚点,3D 动画就这么制作好了。

推特 @taziku_co

在此基础上稍加编辑,静态的模型模型瞬间大秀机械舞,带来十几秒的连贯表演。

推特 @paradoxrenders

转化成游戏动画,也进化成了速通版本,只需要打字就能生成游戏角色动画可能也不再是梦。

其中的模型基础由 Genie 生成,源自 YouTube@OlliHuttunen78

虽然 Genie 1.0 还未完全克服 AI 生成的 3D 模型往往比较模糊这个问题的「最后一公里」。但在引入 Magnific ai 来提升分辨率之后,卡车轮胎上的花纹、排气管的褶皱,连接零件的电线都被勾勒出了清晰的细节,和真实世界中的卡车摆件没什么分别。

推特 @MartinNebelong

Genie 1.0 能做到的正好直击了 3D 设计的痛点,传统的 3D 建模过程通常较为繁琐,往往需要大量专业人员的手工操作,这不仅导致制作周期延长,同时也增加了整体成本。进入动画、游戏、VR 等进一步设计流程后,建模还需进一步调整和修改,设计成本又将成倍上升。

也许正如 Luma AI 创始人 Amit Jain 所说:「借助 Genie,运用 AI 大规模制作 3D 物品或许将不再只是幻想。」

在 Genie 的加持下,即使不会 3D 建模和绘画设计,但有一个涉及 3D 图形或 3D 场景的想法,你都可以让它像精灵一样实现你任何的想法。

目前,Genie 既有免费版,也有付费 API。付费界面每次需要花费 1 美元。该公司指出,这比依靠人类设计师更便宜、更快捷。

Luma AI 公司介绍

推出 Genie1.0 的 Luma AI 是一家生成式人工智能初创公司,该公司一直致力于 3D 内容方案,主要产品和功能包括图片转 3D、视频转 3D、文本转 3D 等。

这家公司成立于 2021 年,首席执行官 Amit Jain 曾是苹果公司的计算机视觉系统工程师,首席技术官 Alex Yu 曾是加州大学伯克利分校的研究生(放弃博士学业创办了 Luma AI )。二人在 3D 视觉、机器学习、实时图形学等领域都有所建树。


这家公司已经经历了数轮融资,其中在由 Amplify Partners、Nventures(Nvidia 投资部门)和 General Catalyst 领投的 A 轮融资中筹集了 2000 万美元,在由硅谷顶级风投公司 Andreessen Horowitz、英伟达领投的 B 轮融资中筹集了 4300 万美元。截至目前,公司共融资 7000 多万美元,估值在 2 亿到 3 亿美元之间。

就其产品而言,不同于文本转图像模型所产出的数字艺术平面位图,Luma AI 利用 AI 从照片、视频或文字描述中创建物体的 3D 模型,这些模型可以根据需要被下载、操作、编辑和渲染。

去年 11 月,Luma AI 在 Discord 服务器上推出了文生 3D 模型 Genie。这次的 1.0 版本,把出图时间从 20 多秒提升到了 10 秒之内。


Luma AI 的核心技术是神经辐射场(NeRF)算法。Luma AI 基于 NeRF 做了很多改进和优化。在场景图像获取、数据预处理、模型训练、模型渲染及其他模型文件的生成等方面,Luma AI 均做了很多优化工作。在此基础上,技术更高超的人类艺术家可以高效地制作更好的模型。此外,Genie 的输出或许也能满足一些人的特定生产需求。

同日,Luma AI 还官宣了三位新成员,其中首席科学家宋佳铭(Jiaming Song)将领导基础模型研究团队。他本科毕业于清华大学,硕博毕业于斯坦福大学。在加入 Luma AI 之前,他曾担任英伟达学习和感知(Learning and Perception)研究团队和深度想象(Deep Imagination)研究团队的研究科学家。


另外,加州大学伯克利分校博士 Matthew Tancik 将领导应用研究团队,来自苹果设计工作室的 Tuhin Kumar 领导界面、交互和产品设计团队。



参考链接:
https://techcrunch.com/2024/01/09/luma-raises-43m-to-build-ai-that-crafts-3d-models/
https://twitter.com/LumaLabsAI/status/1744778363330535860
https://www.theregister.com/2024/01/10/textto3d_image_startup_luma/


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
红色日记 电影《创业》 5.1-31智能周报|Google发布Gemini;OpenAI推迟发布GPT商店;微软明年发布新版Windows,AI功能大幅增强…“平替版Midjourney”,上线1年超700万用户,生成图片超7亿张Let’s Journey初邂烟雨江南NeurIPS 2023 | 单张图片3D数字人重建新SOTA!浙大&悉尼科技大学发布GTA新MacBook Air或明年春季推出/Google发布Gemini大模型,多领域超越GPT-4/微软Copilot重磅升级Surge in Chinese Students Using AI for Academic Edge: New Survey苹果Vision Pro硬件大佬被挖角,Midjourney布局VR头显?未来将发布AI生成3D世界引擎30多万起!Surrey市中心现“显眼包”,全楼开盘只需10%定金!Midjourney V6超进化,大神网友深度评测来了!画质逼真到可怕,人像图片令人惊呆请杨紫琼代言?lululemon太会选!AI 鲜测|2024 年谁还用手画原画啊!直接 Midjourney 生成就行了太极与做家务Discord 使用单台服务器服务于 100 万在线 MidJourney 用户AI早知道|科大讯飞星火认知大模型 V3.5发布;Midjourney V6动漫微调模型上线如此悲伤,如此愉悦,如此独特--《巨流河》读后感AI生图界扛把子被曝剽窃!复制粘贴好莱坞大片,Midjourney、OpenAI都中枪了Wells Fargo Autograph Journey 信用卡【3月9日实体店上线,5x 酒店,4x 航空,60k开卡奖励】后爸如斯面试技巧|如何回答What is your biggest failure?浓人,nèng死淡人重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型Midjourney文本渲染新升级,与DALL·E 3大比拼,看看谁更强单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法二次元版Midjourney重磅升级V6!动漫风人物超逼真生成,网友上手效果令人疯狂AI早知道|微博上线AI评论机器人“罗伯特”;Midjourney计划上线一致性角色生成功能Wells Fargo Autograph Journey 信用卡【新卡预告:$95年费,60k 开卡奖励】龙年营销哪家强?lululemon请杨紫琼咏春,vivo神龙成为国漫之光|中国案例超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!欧盟是否会迎来新一场债务危机?AI早知道|同花顺推出问财大模型;Midjourney将推文本转视频模型;谷歌即将推出Bard Assistant弥合2D和3D生成之间的次元壁!X-Dreamer:高质量的文本到3D生成模型校友活动 | 2024 Columbia Beijing Alumni New Year Party啥情况?一线城市卖不动了?lululemon抖音开店了ICLR 2024 | Adobe提出DMV3D:3D生成只需30秒!让文本、图像都动起来的新方法!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。