Redian新闻
>
大厂都在研究的多模态学习 , 到底有多强?

大厂都在研究的多模态学习 , 到底有多强?

公众号新闻

多模态生成是指综合使用图像,视频,文本等多种模态信息,进而自动化地生成符合人类视觉,文化的文本片段描述。


这要求其不仅仅考虑文本生成的流畅性,语言丰富性,更要与视觉模态相结合,综合考量时空位置信息。


因此,综合使用视频片段、图片等多种信息实现文本生成是CV与NLP交叉的前沿热点领域


这次我邀请到了在多家大厂担任算法研究员的朋友John老师,利用1小时左右的时间,给大家做一次多模态生成的系统分享。

John老师是计算机视觉全球前十机构高校联合培养博士,在多家大厂担任算法研究员,研究方向为多模态领域,如多模态检索,视音文多模态融合与生成,视觉问答等。

此次分享的时间在12月15日晚20:00开始分享时长大约1小时。以下是分享的大纲:



01
多模态生成的发展与未来


Part1.未来AI研究发展趋势—多模态

· 多模态的发展

· 为什么要学习多模态


Part2.多模态生成的发展与未来

· 发展历程

· 有哪些坑?

· 多模态生成

· 预备知识

· Image caption

· Image generation

· Video caption

· Video generation



扫描下方二维码,支付0.01元预约直播

支付后务必添加客服微信进直播群




02
主讲老师介绍



扫码领取【多模态生成论文】


论文列表

1.Spatiality-guided Transformer for 3D Dense Captioning on Point Clouds

2.X-Trans2Cap_ Cross-Modal Knowledge Transfer using Transformerfor 3D Dense Captioning

3.A Comprehensive Survey of Deep Learning for ImageCaptioning

4.Image Captioning with Semantic Attention

5.Knowing When to Look_ Adaptive Attention viaA Visual Sentinel for Image Captioning

6.Learning to Evaluate Image Captioning

7.SCA-CNN_ Spatial and Channel-wise Attention in Convolutional Networksfor Image Captioning

8.Show and Tell_ A Neural Image Caption Generator

9.Show, Attend and Tell_ Neural Image CaptionGeneration with Visual Attention

10.CLIP4Caption  - CLIP for Video Caption

篇幅有限,仅展示前10篇


扫描下方二维码,支付0.01元预约直播

支付后务必添加客服微信进直播群


如果你想找个大牛带着你学习,在图神经领域快速发文,我给大家推荐下John老师。

以下是招生信息:



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
汇编语言之母100岁逝世:曾和冯·诺依曼一起研究,退休后还在研究神经网络大厂都在做的热点方向比秋裤更暖!比羽绒裤更显瘦!这条黑科技纳米防风裤,到底有多强?多模态与认知相遇,探索更像孩子一样的学习方式 | CNCC 专家谈加拿大经济前景叵测「多模态处理技术」最新2022研究进展综述NeurIPS 2022 | 首个标注详细解释的多模态科学问答数据集,深度学习模型推理有了思维链北京内推 | 微软研究院科学智能中心招聘多模态学习方向研究实习生面向社交媒体的多模态属性级情感分析研究上海数字大脑研究院发布国内首个多模态决策大模型DB1,可实现超复杂问题快速决策台积电正在研究的新型存储技术北京内推 | 北京智源人工智能研究院招聘NLP/多模态算法研究员基于自监督学习的多模态推荐算法细数NLP与CV的融合创新:盘点多模态深度学习这几年大厂都病了!Github累积突破7万star! OpenMMLab到底有多强?萝卜糕和几个小菜从普林斯顿辞职,这位清华女神教授,到底有多强大?Tfh细胞解析-2022丨体液免疫调节研究的切入点,自身免疫病、感染、疫苗、肿瘤研究方向均有进展讲座预告|关于国际法研究的研究赵丽颖新剧和NYU梦幻联动!中国留学生最爱的美国名校到底有多强?从视音角度看多模态学习的过去与未来大厂都在用的液态水滴素材究竟有多惊艳![ 第295期 ]大公司里被提拔、被排挤的经历TPAMI 2023 特刊征稿!大规模多模态学习!超越CLIP!谷歌大脑多模态学习新作CLIPPO:仅从像素理解图像和语言一场直播卖20w条的纳米防风裤,到底有多强?DeepFake从未如此真实!英伟达最新提出的「隐式扭曲」到底有多强?突然火了:10000亿,VC吃饭都在研究它2022年,大厂都在“卷”的推荐系统还有进步空间吗?芯片大戰两个鼻咽癌患者的不同命运陈飞宇女朋友都在念的「康奈尔大学计算机系」,到底有多牛?令人心动的AI offer(四):AIGC、多模态、强化学习、高性能计算等职位,来自腾讯、博世、超参数、智源研究院、MSRA医疗多模态预训练:如何利用非天然配对的医疗图像和文本做对比学习?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。