Redian新闻
>
2022最火的AIGC落地怎么用,阿里达摩院团队深度解读

2022最火的AIGC落地怎么用,阿里达摩院团队深度解读

公众号新闻


2022 年,是 AIGC 爆发的一年。

从 DALL-E 2 到 Stable Diffusion,AIGC 赛道在这一年突然变得热闹起来,也引来了资本的青睐。前不久,Stable Diffusion 背后的 Stability AI 更是获得上亿美元投资,估值已高达 10 亿美元。

对于行业之外的普通人来说,不管 AI 作画还是 AI 写作,都是颇具新鲜感的前沿技术应用。而相关领域从业者或 AI 研究者可能思考得更深入一些。

具体到应用场景中,AIGC 是如何落地的?生成式 AI 技术将带来哪些想象空间?又将如何推动相关产业链的升级?

在最新一期的线上分享中,机器之心邀请到了阿里达摩院团队的多位 AI 专家,为我们介绍 AIGC 领域的最新进展。


在线上分享中,阿里巴巴达摩院机器智能语言技术实验室研究员黄非将作开场介绍。


嘉宾简介:黄非,阿里巴巴达摩院机器智能语言技术实验室研究员,自然语言基础技术,对话技术和多模态翻译团队负责人。他领导了 AliNLP 基础技术研发和业务落地,云小蜜对话技术和多模态翻译技术,并支持集团内外的国际化业务需求。黄非博士毕业于卡耐基梅隆大学计算机学院,之后在 IBM 和 Facebook 从事自然语言处理的研发和技术管理等职位。曾在自然语言处理和人工智能的顶级会议和期刊发表文章 40 多篇,获得美国专利 10 多项,曾担任 ACL,IJCAI,COLING 等多个 NLP 国际会议的领域主席 / 资深程序委员和多个期刊会议论文的审稿人。

分享主题一:阿里通义 - 文生图大模型技术解析与应用探索

分享摘要:本次分享将介绍大规模预训练扩散生成模型「通义 - 文生图」,它基于十亿量级图文数据训练,并通过对数据、模型、训练方式等多个维度优化以提升其收敛稳定性与可扩展性。「通义 - 文生图」的图文匹配得分超过 Imagen,目前已在魔搭ModelScope 平台开放体验,后续迭代版本将公开代码及预训练模型。

  • modelscope 模型主页:https://www.modelscope.cn/models/damo/cv_diffusion_text-to-image-synthesis/summary
  • 体验页面:https://decoder.modelscope.cn

嘉宾简介:黄梁华,阿里巴巴算法专家,2020 年博士毕业于中国科学院自动化研究所。主要研究领域包括预训练表征与生成建模,在 TPAMI, CVPR, ICCV, ECCV, TIP, AAAI, ACMMM 等会议或期刊发表论文十余篇,引用量 1000+。其 TPAMI 论文曾多期入选 ESI 高被引论文与热点论文(全球 Top 0.1%)。近期的研究工作集中在多模态生成大模型预训练、通义 - 文生图大模型的技术研发。

分享主题二:AliceMind 预训练大模型在 AIGC 文本创作的探索

分享摘要:本次分享围绕AliceMind预训练大模型在AIGC 文本创作方向展开,介绍预训练生成大模型如何在AIGC领域发力,涉及到以下几个大模型模型的分享:1)中文超大规模生成模型PLUG;2)GPT-3的中文复现版本;3)多模态统一理解生成模型mPLUG。


相关模型链接

  • 中文GPT-3:https://modelscope.cn/models/damo/nlp_gpt3_text-generation_13B/summary

  • mPLUG:https://modelscope.cn/models/damo/mplug_visual-question-answering_coco_large_en/summary 

  • PLUG:https://modelscope.cn/models/damo/nlp_plug_text-generation_27B/summary 


嘉宾简介:李晨亮,现为阿里巴巴达摩院高级算法工程师。2019 年硕士毕业于北京邮电大学。主要研究方向为自然语言处理,包括预训练语言模型、文本生成、多模态等。曾经在相关领域顶级会议如 ACL、EMNLP、AAAI 等发表十多篇相关论文。参与多个国际评测和比赛,在生成、结构化、多模态的多个相关评测榜单上达到第一,并在多模态 VQA 榜单上首次超越人类水平。 



分享主题三:OFASys:一个面向多模态多任务统一学习的开源 AI 库

分享摘要:本次分享将介绍即将开源的一个用于构建单一模型来完成多模态多任务的开源库 OFASys。它首次支持了包括语音、视频、动作等 7 种模态及其 20 多种任务,可以在十行代码内引入一个新任务和数据集并协同训练。我们训练了一个 OFA + 模型可以同时完成以上 7 种模态的多数生成和理解任务,并达到下游单独 Finetune 效果平均的 90% 以上。

  • 论文链接:https://arxiv.org/abs/2202.03052
  • 项目地址:https://github.com/OFA-Sys/OFA

嘉宾简介:白金泽,阿里巴巴算法专家,2021 年博士毕业于北京大学。主要研究领域包括大模型预训练和多模态表征学习,曾在 AAAI、WWW、ICML 等会议发表多篇论文。近期的研究工作集中于多模态大模型 M6 的预训练基础技术,以及参与多模态多任务学习 OFA & OFASys 的技术研发。


加群看直播

直播间:关注机器之心机动组视频号,北京时间 12 月 8 日 19:00 开播。
交流群:本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。

如群已超出人数限制,请添加机器之心小助手 syncedai6,备注「AIGC」即可加入。


机器之心 · 机动组
机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。
  • 点击阅读原文,访问机动组官网,观看往期回顾;
  • 关注机动组服务号,获取每周直播预告。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【火爆国内的阿华田美食上新】阿华田爆浆泡芙,阿华田蛋糕,阿华田燕麦饮,阿华田夹心饼干!阿里组织大调整,阿里云总裁行癫、CTO鲁肃卸任,阿里集团一号位张勇亲任阿里云总裁丨36氪独家文本智能校对大赛冠军方案!已落地应用,来自苏州大学、达摩院团队达摩院2023十大科技趋势发布:人类对通用AI的想象从未如此具体五年磨一剑:阿里达摩院重磅推出AI模型社区「魔搭」,300+模型全面开源强盗的逻辑AIGC落地门槛被打下来了:硬件预算一口气降至1/46,低成本上手Stable Diffusion2.0,一行代码自动并行突发!阿里云高层大调整,集团CEO张勇兼任阿里云总裁,张建锋专职达摩院阿里组织大调整,阿里云总裁行癫、CTO鲁肃卸任,阿里集团一号位张勇兼任阿里云总裁|36氪独家阿里达摩院Research Intern实习生招聘杭州/北京内推 | 阿里达摩院AliceMind语言模型团队招聘算法实习生深度解读 | 机器学习和深度学习的区别到底是什么?达摩院发布2023十大科技趋势!生成式AI将进入爆发期“魔搭”来了!一文深度解读达摩院推出的AI模型社区令人心动的AI offer:特斯拉、阿里达摩院、荣耀等2023校招、社招等你来克而瑞发布《2022不动产数字化转型发展报告》,深度解读不动产数字化发展现状与趋势阿里达摩院招3D重建方向RI实习生初到美国餐馆打工CVPR 2022|达摩院开源低成本大规模分类框架FFC招人!阿里巴巴达摩院基础视觉智能团队【2023校园招聘】阿里达摩院2023十大科技趋势重磅发布:Chiplet、生成式AI榜上有名博后招募 | 阿里达摩院系统Al实验室招募机器学习方向博士后曝阿里达摩院大模型 M6 带头人杨红霞已离职:个人选择,非行业原因【庭院种菜】在美国北方,茭白怎么过冬?五百年一遇的女子曝阿里达摩院大模型M6带头人杨红霞已离职:个人选择,非行业原因一键抹去瑕疵、褶皱:深入解读达摩院高清人像美肤模型ABPN预言未来!阿里巴巴达摩院发布2023十大科技趋势2022年Q3财报深度解读:重新审视美团畅游法国(26)-薰衣草故乡达摩院:2023十大科技趋势【火爆国内的阿华田系列美食上新】阿华田爆浆泡芙,阿华田蛋糕,阿华田燕麦饮,阿华田夹心饼干!阿里巴巴达摩院-机器智能技术-基础视觉智能团队招聘|2023 校园/实习疫情后硅谷最火的社交应用,是怎么做「从 0 到 1」的?杭州内推 | 阿里达摩院城市大脑实验室招聘三维计算方向研究型实习生
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。