深度学习机器视觉与生成式AI 「云集|职挂云帆」ML学习小组
对于不少人来说,第一次认识到人工智能的厉害是震撼来自于手机相机里的机器视觉和Midjourney生成以假乱真图片的能力。深度学习无疑是这次让人工智能从人工智障大步跨越到超过人类的表现的头号功臣;到底是什么黑魔法让它如此厉害:模型架构,训练技巧,或是海量数据?
Jin & Shawn今天在Newark Library的大教室和我们一步一步解剖了模型其中的架构与奥秘。Jin介绍了机器视觉模型的演化和细节机理,Shawn综述了GAN, VAE, Diffusion模型的思想和迭代。这是我们第一次去Newark的新场地,干净宽敞明亮;也是我们终于学会了如何正确使用麦克风,线上参与者们体验极佳并且再次和我们一起讨论到了几乎超过了活动的预定时间。
嘉宾介绍
Jin, Google SWE
Shawn, Align SimMod
活动精彩瞬间
ChatGPT说
深度学习与机器视觉的结合是一场革命性的融合,引领着人工智能领域的巨大进步。深度学习通过模拟人脑神经元之间的连接方式,构建了多层次的神经网络结构,使计算机能够自主地从大量数据中学习和提取特征。机器视觉则致力于让计算机具备类似人类视觉的能力,即通过分析图像和视频来理解和解释视觉信息。深度学习为机器视觉提供了强大的工具和算法,使计算机能够以前所未有的准确度和速度来执行各种视觉任务,例如图像分类、目标检测、语义分割等。
生成式AI从GAN(生成对抗网络)、VAE(变分自编码器)到Diffusion Models(扩散模型),经历了逐步演化和改进的过程。GAN是一种由生成器和判别器组成的对抗性框架,通过互相博弈的方式使生成器逐渐提高生成的真实度,从而生成逼真的图像、音频或文本等内容。接着,VAE引入了概率模型的思想,通过对数据进行潜在空间的建模,实现更加灵活和可控的生成过程。
最近,Diffusion Models成为生成式AI领域的新宠。Diffusion Models以概率演化的方式逐渐将噪声信号转化为真实样本,通过多次迭代的扩散过程,实现了高质量的图像和视频生成。这种方法在图像修复、超分辨率重建等任务上展现出了强大的能力。生成式AI的不断进化,从简单的生成到逐步掌握更高级的语义和结构信息,推动了计算机创造力的进一步发展,并在艺术、设计、娱乐等领域产生了深远影响,同时也提出了伦理和隐私等新的挑战,需要我们审慎地探索和应对。
感谢所有参加活动的小伙伴们!未来我们还会带来更多好玩实用的技术分享,敬请期待哦!🤩
欢迎加入我们
感兴趣小伙伴欢迎扫码加小助手微信
备注:ML
小助手将拉你入群
关于职挂云帆
职挂云帆,是坐标加州硅谷的“载歌在谷”社区旗下的一档职场访谈类栏目。自2020年9月成立以来,通过职场经验技能分享,帮助在美华人提升专业技能和行业认知,发展职业网络,实现个人成长。欢迎大家关注我们的YouTube频道“职挂云帆”(https://www.youtube.com/@ZGYF),观看往期活动回放。
职挂云帆栏目也致力于加强在美华人群体的联结,会定期举办线下读书会,技术学习小组,hiking等活动。希望大家可以结识更多志同道合的小伙伴,一起在北美职场,乘风破浪,扬帆起航。
加入我们的志愿者大家庭
志愿者长期招募 欢迎报名👏🏻
欢迎扫码 关注我们
职挂云帆Youtube账号
职挂云帆Linkedin账号
金牌赞助商
美食赞助商
微信扫码关注该文公众号作者