Redian新闻
>
硬核课程全网首发!高级人工智能:多模态大模型LLM与AIGC前沿技术实战

硬核课程全网首发!高级人工智能:多模态大模型LLM与AIGC前沿技术实战

公众号新闻



2023夏季班招生简章

高级人工智能:多模态大模型LLM与AIGC前沿技术实战

Advanced Artificial Intelligence:

LLM & AIGC cutting-edged Training Camp


在这一次AIGC的革新中 你不必是一名旁观者

用4个月时间构建自己的多模态LLM机器人

GPT-4机器人7*24小时做你的私人助教

把握技术革新 突破职业瓶颈

硅谷专家 GPT开源贡献者

带你攻克最新技术


以 ChatGPT,Midjourney 为代表的的生成模型从 2022 年下半年开始为这个世界带来了巨大的震撼,目前众多公司也积极投身于此,新兴的 AI 产品如雨后春笋般出现。可是作为企业用人方,会发现掌握 AIGC 核心技术的人才寥寥无几,而我们作为求职者,希望加入这次技术浪潮却也不知道如何入门。这门课程,硅谷AI算法研究员、ChatGPT 相关开源版作者带你手把手掌握这些核心知识,不论是找工作,还是自己完成AI项目,都能有效地帮助你!


注意:本课程不是一门面向非技术人员通识课,也不是一门教大家怎么使用 AIGC 工具的课程。


你现在是否面临以下问题?


● 作为传统的技术工作者,算法工作者,看到最近的技术发展,希望能够加入此次技术革命,突破职业瓶颈;


● 在 AIGC 的浪潮下,Transformer, LLM, Diffusion, LoRa, Prompt Enginering, GPT-3.5/4, PPO, HFRL, DALL-E, ViTransformer, WGAN, Pix2Pix 这些技术你是否感到迷茫?这门课程带你一次性从原理到实战掌握以上概念!


● 想做自己的大模型,没有合适的机器,数据,找不到门路?这门课为你提供最先进的 A100(速度为 V100 的 150%,P100GPU 的 3500%)与项目完整流程,让你动手实战,掌握内容!


本课程特色


1. 本课程区别于目前其他对于 AIGC 进行科普、工具使用类的课程。我们邀请的老师都是从 2017 年 WordEmbedding 第一个预训练模型推出就开始进行大模型模型相关工作、研发的一线研发人员。导师对于大模型、预训练的理解和实践经验能够非常实际地帮助大家。


2. 本课程为了能够让大家进一步理解目前 GPT 相关产品的能力,表现,以及性能极限,我们全程为大家提供以 OpenAI 最新的 GPT-4 作为 API 驱动的助教机器人。助教机器人与你一对一交流,7*24 小时解决你的任何问题。并且,你在这个过程中,会对目前 AIGC 的能力有更加深刻、实际的理解。


3. 区别于浅尝辄止的“学习”,“研讨”怎么使用现有的 AIGC 项目,我们导师带领大家完成 4 次完整、前沿的 AIGC 项目实战。从 Transformer,GPT,Diffusion,GAN,让大家全链路掌握 AIGC 的核心技术。 并且此次参与课程的同学能够参与开源版 ChatGPT 项目。项目作者亲自授课,不仅锻炼自己的能力,更能使得你在 AI 岗位求职中脱颖而出。


4. 本课程为大家提供了目前 Nvidia 最先进的 A100 服务器。以及 30 核 CPU 服务器。为大家的模型训练保驾护航!


导师介绍


赵老师:硅谷行业头部大厂计算机视觉 AI 算法研究员,毕业于美国佛罗里达大学计算机科学系。超过 10 年 AI 与深度学习,计算机视觉与图形学等领域经验。工作中对预训练模型,尤其是视觉深度学习模型(CNN / ViT 等)有深刻理解和实战经验。赵老师在工作之余帮助计算机视觉从业者提升从业能力,其课程深入浅出,高屋建瓴,在计算机视觉从业者中广受好评。


郭老师:中国头部互联网企业算法工程师,开源大语言模型(ChatGLM, CPM)贡献者,开源项目爱好者。从 2013 年起一直从事 NLP 相关工程及研究工作,具备丰富的产业实战经验。


高老师:前 IBM 人工智能与认知服务数据科学家,目前在美国加州从事 AI 研究。自 2012 年起进行对话机器人的研究工作。近十多来持续从事人工智能相关研究、企业落地。曾经作为技术负责人参与落地多个大中华区AI项目。



授课计划


● 课程合计 18 周(或 18 + 8 周求职机试指导)

● 每周3小时直播研讨+实战代码指导课,基于在线视频会议



AIGC课程详细安排

Detailed Curriculum

本次课程正式开始时间为2023年5月7日,5月7日之前,我们为大家提供 pyTorch,强化学习,预训练模型等预习资料。并且大家可以开始使用基于 GPT-4 的机器人,感受其能力。



第一

部分

导论预备课程/ 授课老师,高老师


第一周 : 从WordEmbedding到Transformer


  • 什么是预训练模型?为什么需要进行本文的向量化?

  • 从 Word2Vec,GLoVE,FastText,再到self-Attention 机制,Transformer 的原理变迁与技术增长路线

  • 大规模预训练模型在图片、图网络中(Graph Network)中的应用和影响

  • 什么是多模态?多模态的意义是什么?原理是什么?


第二周 : 强化学习的原理,强化学习与 AIGC 的关系和作用 (因内容交错,本节课程大约为 5 个小时)


  • 强化学习在AIGC中的作用

  • 马尔科夫决策过程,Bellman方程

  • 从蒙特卡洛模拟到Temperal Difference

  • Q-Learning与Deep-Q-Learning

  • Policy Gradient,REINFORCE 算法

  • PPO算法的原理


第二

部分

大语言模型(LLM)与文本生成

/ 主讲老师,郭老师


第三周 : 大语言模型在自然语言处理中的应用


  • Self-attention与multi-head多头Transformer的原理详解

  • GPT模型的原理

  • GPT-2/3/3.5/4的演化和比较

  • BERT, RoBERTa, T5, XLnet等模型的对比

  • 目前其他主流语言模型的比较

  • 如何根据业务选择最合适自己的语言模型


第四周 : 大语言模型的 Fine-Tuning, Prompt Engineering


  • Fine-Tuning的原理,迁移学习的原理以及它与LLM的关系

  • Pre-Train预训练与Fine-Tuning的工作流

  • 如何解决数据集相关问题

  • Instruction Learning

  • Few-Short Leanring与Meta-Leanring,few-short leanring在LLM中应用

  • 使用Prompt来完成自定义任务,Prompt的设计与优化方法

  • Prompt-Tuning技术,Prompt-Tuning与传统Fine-Tunning技术的区别


第五周 : 基于人类反馈的强化学习训练(RLHF)


  • LoRa: Learning from Rules and Arguments. 基于规则定义的语言能力增强

  • 人机交互AI系统的工作流与框架(workflow与framework)

  • PPO算法在ChatGPT中的应用分析

  • 如何设计Reward Model

  • PPO算法在ChatGPT中的算法实践

  • Off-Policy训练与Importance Sampling

  • Imitation与Reverse Reinforcement Learning在RLHF中的应用


第六周 : 大语言模型的部署实践


  • 模型压缩与剪枝技术、知识蒸馏

  • ONNX + TensorRT

  • 模型部署的量化技术

  • GPTQ量化: Post-Trainng Quantization for Generative Pre-trained Transformers


第七周 : 基于开源模型的多模态实践


  • Visual-ChatGPT的原理

  • 如何准备自己的数据集

  • Finetune ChatGLM


第八周 : 开源版ChatGPT的待完成任务解析


  • ChatGLM-Tuning的原理与项目架构解析

  • 目前待完成的任务介绍与完成过程分析

  • 成为该项目贡献者的指引

  • 第一个大项目:成为开源版ChatGPT——ChatGLM-Tuning的源代码贡献者


项目介绍:通过前八周的课程,大家对自然语言处理相关的预训练模型,尤其是 Transformer,HFRL,GPT,Prompt 等技术都有了一定的理论基础。那么现在,大家就要将这些知识转化为实际的项目,我们将参与完成 ChatGLM-Tuning 项目中的功能,我们的导师将指导大家完成。通过这个项目,你不仅亲手实践,学习了最新的 GPT 大模型相关的实操构建,进一步构建符合自己的需求、符合公司业务需求大模型对话机器人,并且目前各个公司人工智能项目对掌握此能力的人才需求量大涨,而该项目会为自己的简历添加重要的项目履历。


▲  图例:项目1示例



第三

部分

Transformers与计算机视觉

/ 主讲老师,赵老师


第九周 : 视觉 Transformer(ViT)及视觉 AIGC 导论


  • 视觉AIGC的学习目标

  • 视觉AIGC方向求职的面试准备与业务学习

  • ViT的理论介绍与实现原理

  • ViT: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

  • DeiT: Training Data-Efficient Image Transformers & Distillation through Attention

  • TNT: Transformer in Transformer

  • ConVit、MLP-Mixer、Swin Transformer等混合方案


第十周 : ViT 的高级方法,DALL-E


  • Transformer的结构升级

  • 视频Transformer:TimeSFormer, VideTransformer

  • Transformer,GPT与图像生成模型

  • DALL-E:基于文本生成图像的原理

  • ViT与计算机视觉专门问题的结合应用:

    检测任务(Object Detection)与ViT

    分割任务(Semantic Segmentation)与ViT

    Image Caption

    项目二导引:利用 ViT 进行图像分类/物体检测



项目介绍:通过该项目能够掌握 ViT 的理论认识以及上手技能;同时,也能理解 CV 领域一路走来的发展,无论是技术上从传统 CV 算法,到深度学习(deep learning,也即 DL)卷积神经网络(Convolutional Neural Network,也即 CNN),再到现阶段 ViT,还是从内容上的分类/检测入手。因而,通过这个项目,能够使同学对 CV 领域的技术与内容,有直观也深入的理解。同时,由于 Transformer 的天然特性,也对非视觉类数据的处理有了一定的积累。



第四

部分

深度神经网络与计算机视觉:第一类生成模型

/ 主讲老师,赵老师


第十一周 : 对抗生成网络(GAN, Generative Adversarial Network )


  • GAN的结构与原理:Discriminator/Generator

  • GAN原理详解:KL/JS散度,最优判别器

  • GAN的原始实现方法


第十二周 : GAN的发展与Wasserstein GAN


  • GAN存在的问题:Mode Collapse,难以训练

  • 以上问题优化的原理与优化目标

  • Wasserstein GAN(WGAN)与原理,WGAN-GP

  • Unrolled GAN, Spectral Normalization, Noise Injection, Mixing Regularizationd等其他优化方法


第十三周 : GAN的高级应用


  • 实例分析:视频中的颜色矫正

  • 从UNet到WNet的升级

  • WGAN-GP与Patch GAN的结合

  • Perceptual Loss的应用

  • 光流(optical flow):基础且重要的视觉理论


第十四周 : GAN的进阶发展


  • Pix2Pix:Conditional GAN + Patch GNA

  • Cycle-GAN:非成对数据与Consistency Loss

  • SPADE:可控 GAPN


第十五周 : 项目指引课:GAN 在图像矫正领域的应用


项目介绍:GAN 是一类强大的生成类模型,其早于 diffusion model,因而已真实应用于实际场景当中。在这个项目中,我们将利用所学的 GAN 相关知识,进行静态图片与动态视频的矫正工作。切实体会课上所讲的理论知识如何应用在实际工作中,并能够避免很多目前所存在的人云 亦云似的一知半解的讹传,真正做到学以致用。同时,在项目进行中,会介绍大量切实可行 的技巧,这些技巧是普适的,能够被所有架构应用。不仅如此,我们也会介绍一些 CV 领域底层的思想,使大家的学习工作不仅流于表面,也能够深入到本质。


▲ 图例:项目3示例



第五

部分

Latent Diffusion: 

第二类生成模型与其应用


第十六周 : Latent Diffusion 导论


  • Diffusion 过程与生成模型

  • Denoising diffusion probabilistic model(DDPM)介绍

  • Latent diffusion model(LDM)原理

  • LDM 的实现原理和方法

  • LDM 的应用: 图像、视频、文本生成


第十七周 : Diffusion Model 进阶


  • Diffusion Model 进展:Learnable Diffusion, Reversible generative model 与 LDM

  • 面向未来的Diffusion: Causal generative modeling, 数据缺失

  • Diffusion与强化学习的结合


第十八周 : 结业项目:利用 Latent Diffusion Model进行基于文字描述的图像生成


项目介绍:在经过第一个项目(进行 ViT/Transformer 技能储备)以及第二个项目(CV 技能储备)后,我们终于做好储备,得以迎来最后一部分的项目内容,即进行利用 LDM 的图像生成工作。


LDM 是最新的生成式模型,其内容上的最大特点便是利用语言文字进行图像生成;同时在技术上,也与 GAN 不同。具有训练相对简单,效果相对较好(当然,通过我们的讲解,GAN 技术同样也可以做到此点)的特点,因而目前热度较高。在这个背景下,我们将带领大家直 观感受 LDM 究竟是如何完成这点的。


▲ 图例:项目4 示例





课程收费



5.1 前沿实战班

课程售价 : 10800元或1500美金

4 个月直播课程训练;

参与开源 ChatGLM 功能开发,成为 Github 高星项目参与者;

完成自己的 Latent Diffusion Model 文本生成模型

提供 30 核 CPU 服务器;



5.2 就业强化班

课程售价 : 13800元或1900美金

包含“前沿实战班”所有权益

机试攻克:包含目前售价为 7800 元持续 8 周的算法机试强化课程——授课老师为赵老师,硅谷算法 AI 算法研究员

实战强化:提供 30 核 40G NVIDIA-A100 GPU 先进服务器(A100GPU 计算速度为 V100 的 155%,为 P100GPU 的 3500%)

注:本次提供的GPU使用时长为4个月



5.3 课程开始时间

2023年5月7日(周日)早上9:30



5.4 不满意退费保障

本次课程正式开始时间为2023年5月7日,我们为大家提供为期一个月的退费期,不满意可随时提出退款。

付费至- 5月21日:提出退费 3天内退还100%学费

5月22日-5月28日:提出退费 3天内退还50%学费

5月29日-6月06日:提出退费 3天内退还25%学费



相关QA


6.1. 本课程的学员构成是怎样的?


回答:我们只开设最前沿的核心技术课程,以最近一年我们的学员为例:其中 75% 为 AI 研发人员,大学老师或者相关科研人员,20% 的学员为相关专业的高年级研究生。


6.2. 本课程是否能提供发票?


回答:本课程能够开具发票。事实上,我们课程中有大约 25% 的学员是大学老师或者研究员,我们的课程为他们提供了非常实际的帮助。


6.3. 我的基础不太够,但是我很想学,该怎么办? 


如果您的基础不太够,我们这里有从 Python 零基础到神经网络,再到深度学习、CNN,计算机视觉,自然语言处理的全系列AI基础课程。我们都是免费提供给大家。大家可以先学习基础课程,等待下一期开班。




报名


预报名2023夏季AIGC课程的同学请咨询下方二维码

因时差问题,微信通过可能需要大家等待,感谢理解!

前30名报名可享有GPT-4私人助理机器人1年使用权限,报名后即可使用


课程监制与出品人-高老师

(高老师,赵老师往期学员凭学习记录可享受一定优惠)




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
2对夫妻自驾游,晚上妻子故意装睡,看到丈夫惊人的举动提出离婚人工智能大PK!Meta挑战ChatGPT,推出语音模型LLaMA...在线可玩:阿里开源多模态大模型mPLUG-Owl,电影问答、梗图理解、多轮聊天……倒计时2天!顶级专家联合打造,“大模型前沿技术讲习班”周末开讲,提供多种全额奖学金微软:多模态大模型GPT-4就在下周,撞车百度?独家 | 多模态大模型初创企业“智子引擎”,近日完成千万元天使轮融资匹兹堡记事 - 2022.12.28 公寓过户GPT-4刷屏,这家中国AI企业多模态大模型已落地应用多年,新版本内测了(可申请)好大一場夢阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl为多模态LLM指明方向,邱锡鹏团队提出具有内生跨模态能力的SpeechGPTCVPR 2023 | 中山大学HCP实验室新突破:用因果范式再升级多模态大模型从LLM到MLLM,多模态大规模语言模型KOSMOS-1赋予了语言模型看见世界的能力李志飞:关于GPT-4的八点观察,多模态大模型竞赛开始达摩院猫头鹰mPLUG-Owl亮相:模块化多模态大模型,追赶GPT-4多模态能力「AI专家」贾斯汀·卡塞尔:语言模型更像“鹦鹉学舌”,下一步人工智能浪潮是多模态AI训练成本不到1000元,直降90%!NUS、清华发布VPGTrans:轻松定制类GPT-4多模态大模型上野千鹤子的"熟男十戒"你怎么看跟孩子不要讲太多钱,也不要太多讲自己。GPT-4震撼发布:多模态大模型,升级ChatGPT和必应,开放API,太太太强了!追赶GPT-4的多模态大模型对比分析威大哥大等联合发文!最新多模态大模型LLaVA问世,水平直逼GPT-4比尔盖茨:超级人工智能还没来,GPT模型是40余年来最革命性技术进步VPGTrans: 10%的成本定制你自己的类GPT-4多模态大模型苹果Siri、亚马逊Alexa计划集成LLM;电信推出通用视觉大模型;欧盟达成《人工智能法》协议丨AIGC大事日报训练开销骤减,10%成本定制专属类GPT-4多模态大模型李开复发布“英雄帖”:亲自筹组Project AI 2.0,广召大模型、多模态等顶级人才|甲子光年融资千万,结盟软通动力,人大多模态大模型元乘象正在圈地大B市场|甲子光年中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作多模态如何自监督?爱丁堡等最新「自监督多模态学习」综述:目标函数、数据对齐和模型架构最新ReWOO框架直指Auto-GPT和LangChain代理的冗杂性,提出轻量级LLM与工具的交互范式独家 | 多模态大模型初创企业「智子引擎」,近日完成千万元天使轮融资中山大学HCP实验室新突破:用因果范式再升级多模态大模型GPT-4震撼发布:多模态大模型,直接升级ChatGPT、必应,开放API,游戏终结了?北京出手通用人工智能:产业创新伙伴计划公布,要推动大模型产业加速落地
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。