Redian新闻
>
该死,我又心动了,这都能行

该死,我又心动了,这都能行

科技

大家好,我是假期努力肝文的 Jack。

多模态是近几年的热点,文本到图像的合成算法,更是卷上了天。

谷歌的 Imagen 超越 OpenAI 的 DALL・E 2,成为了新的 SOTA。

Imagen 文本到图像的生成可谓是天马行空,能够生成各种有趣的图片。

比如给 Imagen 算法输入:

一张背着旅行包的柴犬户外骑行照,它戴着墨镜,头顶沙滩帽。

泰迪熊的 400 米蝶泳首秀。

愤怒的小鸟。

Imagen 算法原理如下:

首先,算法会采用 frozen T5-XXL 编码器对接收到的文本进行编码。

输出送给文本转图像的扩散模型,并输入给两个超分辨率扩散模型。

文本转图像的扩散模型输出的图像分辨率是 64 * 64的,然后再经过两次超分,得到最终 1024 * 1024 的图像。

项目仓库 3 月份就建好了,不过直到 6 月,也就是这两天,才正式开源。

项目地址:

https://github.com/lucidrains/imagen-pytorch

对这类算法感兴趣的小伙伴,一定要去试试,效果提升很不错~

在我之前介绍 DALL・E 2 的就有小伙伴脑洞大开留言道:

既然能用文本生成图片,那是不是也能用文本生成视频?

CogVideo 它来了!

咱们先看下 CogVideo 的文本生成视频的效果。

一个视频都是根据一段文本描述生成的。

比如输入文本:

一个男人在海里奔跑。

CogVideo 算法会生成一系列的图片,最终生成视频。

CogVideo 算法的流程如下:

第一部分先基于CogView2,通过文本生成几帧图像,这时候合成视频的帧率还很低;

这个算法是文本生成图片的,大家可以在这里体验第一版的 CogView 效果:

https://wudao.aminer.cn/CogView/index.html

我试了一下,齐刘海的狮子,它可能理解不了,哈哈。

第二部分则会基于双向注意力模型对生成的几帧图像进行插帧,来生成帧率更高的完整视频。

给大家放几组效果,感受一下。

不过这个代码还没有开源,只是建了仓库,可以先 star 标记一下。

https://github.com/thudm/cogvideo

今天主要是介绍这类算法的进展,没教大家怎么部署环境,感兴趣的小伙伴,可以先自己根据 readme 进行配置。

行了,今天就聊这么多吧,我是 Jack,我们下期见!

·················END·················

推荐阅读

•   学了十年代码,写的真人AI体感游戏•   其实今年,我也挣不到钱了。•   我与身旁的美女,格格不入,我决定...

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
买房就给$ 25,000首付!纽约华人心动了,搬家,就在皇后区对岸 ...臭棋篓子跟风刘畊宏3天我又放弃了,倒是这根“绳”让运动自律了精读俱乐部 | 因为有你,我再平凡也能行走在世界之巅《Freak The Mighty》在谷歌刚发布的安卓13里,我又找到了华为的技术。。。官宣:这个土豪国要给世界百强校毕业生发绿卡!澳洲的你心动了吗心动了!疫情导致英国该行业狂缺工签人才,毕业生起薪50k!留学专业都给你总结好了!情感bot | 「整容女」后续——和穷学生在一起后,我又后悔了用脑机接口「治愈」耳鸣,马斯克对 Neuralink 的设想真能行?在这个有雷暴的礼拜天,我又打开了旧手机,于是…《人世间》观感4归来哟 浪迹天涯的游子“粘你是因为爱你,这都是为你好......” | 身处“假爱”之中,该如何走出来?凶狠|枪杀17人的美国屠夫该不该死?!全球围观法庭怎么判啊啊啊,我又有新的突破了!先定罪再制造证据法律上叫什么带娃来了6趟还没腻,这个25°C的海边城市好吃又好逛!看完她的1000块攻略可太心动了泥人今天,我又想起那一年的胡歌在这里,我又敢有梦想了喝奶茶,送股票!奈雪教炒股,账户「绿到发光」的我心动了第一集就疯狂开车,国产剧这都能播了?WAR STORY《龙珠》18号:眼神对上的瞬间我心动了!波屯探校园5|仿佛在哈利波特的魔法学院上学?波士顿学院的校园你心动了吗?双减9个月后,聊聊要不要学奥数:对不起,我又要说大实话了……[照片] 带着徕卡Q出门采风,偶遇两位美丽的姑娘,你心动了吗?看了海淀、东城、西城小学生的暑假安排,我又一次感觉到世界的参差刺激啊,这都能上映?今天,我又发现了童薇菁的更多优秀之处Github 有份程序员们做的菜谱,终于没有了该死的“适量”时隔两年,我又来到了演唱会现场该死,这糟糕的心动感【阿瓦隆】玩家集结令继续!这该死的魅力!看到凯特王妃的高定礼服,我心动了!团|安全省心的母婴王牌,我又发现了新款宝藏!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。