Redian新闻
>
GAN、扩散模型应有尽有,CMU出品的生成模型专属搜索引擎Modelverse来了

GAN、扩散模型应有尽有,CMU出品的生成模型专属搜索引擎Modelverse来了

公众号新闻

机器之心报道

机器之心编辑部
生成模型也有自己的搜索引擎啦!


从前几年出尽风头的 GAN 到今年独占鳌头的 Stable Diffusion,预训练生成模型一直风头不减,相关论文、模型也是层出不穷。这就带来了一些问题:如何在众多模型中找到自己想要的那一个?如何找到对应模型的学习资料(比如代码库)?自己做了个新模型如何与更多的人分享(除了发推特)?


近日,卡内基梅隆大学助理教授朱俊彦等人开发了一个名为「Modelverse」的在线分享和搜索平台来解决这些问题。



Modelverse 是一个包含多种深度生成模型的模型共享和搜索平台,例如 GAN、扩散模型和自回归模型,题材包括动物、风景、肖像和艺术品等。你可以在这个平台上查找或者共享深度生成模型。



平台链接:https://modelverse.cs.cmu.edu/


平台提供的搜索方式是多样化的,你可以输入文字检索,也可以输入图像、简笔画或多模态信息检索。



比如,以一张飞机的简笔画作为输入,我们可以得到以下结果:



以大象的图片为输入,我们也能找到可以生成大象图像的 GAN 模型:




那么,这些功能具体是怎么实现的呢?


在最新公布的论文中,作者进行了详细的介绍。



论文链接:https://arxiv.org/pdf/2210.03116.pdf


该搜索系统由预缓存阶段(a,b)和推理阶段(c)组成。给定一组模型,(a)首先为每个模型生成 50K 的样本。(b)然后将图像编码为图像特征并计算每个模型的一阶和二阶特征统计。统计数据被缓存在系统中,以提高效率。(c)在推理时,系统支持不同模式(文本、图像或草图)的查询。系统将查询编码为特征向量,并评估查询特征与每个模型的统计数据之间的相似性,由此检索具有最佳相似性度量的模型。



搜索结果


模型检索的定性结果。下面展示了三种不同模态的模型检索结果,分别是图像、草图、文本。


该系统还支持多模态查询 (下图左) ,并支持使用模型作为查询来查找相似的模型 (下图右)。



图像重建与编辑。随着生成模型数量的爆发式增长,用户越来越不可能了解每一个有趣的模型,但是为自己的特定用途选择正确的模型可能是至关重要的。下图显示,选择正确的生成模型进行图像查询可以得到更好的转换结果,从而更好地进行潜在空间插值和图像编辑。



但我们可以发现,这个搜索系统还存在一些局限性。如下图(左)所示,有时侯草图查询(例如,鸟的草图)会匹配具有抽象风格的模型。CLIP 特征是否与草图的形状、样式、纹理相匹配是不明确的。如下图(右)所示,对于彼此冲突的多模态查询(大象文本 + 狗图像),系统就难以检索具有这两个概念的模型——排名靠前的模型中没有大象模型。


随着平台上共享的模型越来越多,平台的搜索体验有望逐步改善。


2023 AI 应届生,准备好冲刺更满意的offer了吗?


10月15日上海,抓住秋招黄金期!欢迎应届高校青年学子一起参与这场技术沙龙与私享晚宴。
  • 交流高效——设置报告、对谈、自由交流、晚宴等环节,不仅可以聆听业界前辈学术研究指导与建议,还可以与专家学者面对面自由深入交流。

  • 量身打造——提供有行业竞争力的薪酬和优先落户等硬核福利,以及广阔的发展空间。

  • 参与便捷——视报名同学学校分布情况提供定点接驳车,获取接驳时间、地址与更多活动详情请添加小助手微信号REDtech01。

扫面图片报名二维码,锁定线下稀缺参会席位。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
教育随笔(105)高考文言文备考之六Hunt Good 周报丨Notion 要用 AI 帮你写笔记 / Rewind 搭建「人生搜索引擎」雏形Hunt Good 周报|《黑镜》成真!这款 app 做的「人生搜索引擎」火了卷!MIT泊松流生成模型击败扩散模型,兼顾质量与速度生成扩散模型漫谈:统一扩散模型(理论篇)3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,重点是zero-shot「心识宇宙」连获近亿元投资,发布AI角色生成引擎MindOS|36氪首发7 Papers & Radios | 扩散模型只用文字PS照片;MIT泊松流生成模型击败扩散模型Feep! search:一款面向程序员的搜索引擎,收录信息超2900万页!刺激!美国巧克力集结啦:松露,Lindt,夏威夷,费列罗,应有尽有生成扩散模型漫谈:最优扩散方差估计(上)大一统视角理解扩散模型Understanding Diffusion Models: A Unified Perspective什么咖啡最好喝?众说纷纭呀!吃货福利! 密西沙加竟然新开了这么多好吃的餐厅, 亚洲融合菜、北非美食应有尽有视频搜索越来越好,会颠覆传统搜索引擎吗?3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,给一个文本提示就能生成3D模型!生成扩散模型漫谈:最优扩散方差估计(下)AI 生成模型五花八门,谁好谁坏?CMU 朱俊彦团队推出首个自动匹配排名系统不用关键词也能精准搜索,新AI搜索引擎火了,网友:刚用5分钟就设为默认视频生成经典模型资源(一):TGAN、VGAN、MoCoGAN、SVG、vid2vid、VideoVAE、DVD-GANCostco 的红油抄手,Aldi的美味青口和几款小菜7 Papers & Radios | 谷歌推出DreamBooth扩散模型;张益唐零点猜想论文出炉华人快冲!澳洲CW药店赠送免费护肤大礼包!护肤、化妆品应有尽有!内含35种产品扩散模型再下一城!AR-LDM:用扩散模型合成连贯视觉故事!输入字幕就能脑补画面,代词ta都分得清团购:秋冬必备单品、围巾、暖拖鞋、润唇膏、护手霜、毛毯应有尽有!如何每周花两分钟时间达到锻炼效果​生成扩散模型漫谈:条件控制生成结果如何生成「好」的图?面向图生成的深度生成模型系统综述|TPAMI2022人生乐在相知心(图)卷!MIT提出泊松流生成模型击败扩散模型,兼顾质量与速度采样提速256倍,蒸馏扩散模型生成图像质量媲美教师模型,只需4步
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。