Redian新闻
>
生成式AI时代的模型压缩与加速,韩松主讲MIT课程,资料全公开

生成式AI时代的模型压缩与加速,韩松主讲MIT课程,资料全公开

公众号新闻

机器之心报道

编辑:蛋酱


近年来,生成式大模型(如大语言模型、扩散模型)已显示出卓越的性能,但它们需要大量的计算资源。为了让这些模型更易于使用,提高它们的效率至关重要。

在最新的一季 MIT 6.5940 课程中,MIT 学者韩松将深入解读生成式大模型时代的「AI 计算的模型压缩与加速技术」。


课程主页:https://efficientml.ai/

课程全名为《TinyML 和高效的深度学习计算》。概括来说,这门课程将介绍高效的人工智能计算技术,以便在资源有限的设备上实现强大的深度学习应用。

课程主题包括模型压缩、剪枝、量化、神经架构搜索、分布式训练、数据 / 模型并行化、梯度压缩和设备微调,还介绍了针对大语言模型、扩散模型、视频识别和点云的特定应用加速技术,并涵盖了量子机器学习的相关主题。此外,学生将获得在笔记本电脑上部署大型语言模型(如 LLaMA 2)的实践经验。

最重要的是,这门课程的全部视频资源将上传到 Youtube 平台。


播放列表地址:https://youtube.com/playlist?list=PL80kAHvQbh-pT4lCkDT53zT8DKmhE0idB&feature=shared

课程大纲

课程整体规划如下图所示:



目前,Youtube 栏目中已经更新了前五章的授课内容:第一章 Introduction,第二章是神经网络基础,第三、四章是剪枝和稀疏性,第五章是量化。


鉴于目前课程还在进行中,如果你对即将要学的内容非常好奇,也可以先行参考其 2022 年秋季的授课资料,包含视频和 PPT。

下载地址:https://www.dropbox.com/sh/0ftluqbd1afzqpy/AADqxwkYrt1FbGnSQ4KP3Kpva?dl=0

讲师介绍

这门课程由MIT副教授韩松主讲,并由他的两位博士生林吉和蔡涵担任助教。


韩松在斯坦福大学获得博士学位,2018 年加入 MIT,现为电子工程科学系副教授,研究广泛涉足深度学习和计算机体系结构。


韩松团队在硬件感知神经架构搜索(once-for-all network)方面的工作使用户能够设计、优化、缩小人工智能模型,并将其部署到资源受限的硬件设备上。

他曾提出包括剪枝和量化在内的「深度压缩」(Deep Compression)技术。

他还提出了「高效推理引擎」(Efficient Inference Engine,EIE),首次将权重稀疏性引入现代 AI 芯片,并影响了英伟达公司带有稀疏张量核心的安培 GPU 架构。

顺便一提,韩松博士的两次创业,均获得了 AI 领域的高度关注。

博士期间,韩松与同为清华大学毕业的汪玉、姚颂联合创立了深鉴科技(DeePhi Tech),其核心技术之一为神经网络压缩算法,随后深鉴科技被美国半导体公司赛灵思收购。

2021 年,韩松与吴迪、毛慧子共同成立 AI 边缘计算公司 OmniML,旨在通过创建深度学习模型来弥合 AI 应用程序与边缘上的各种设备之间的差距,从而提高 AI 的速度、准确性和效率。今年,该公司被英伟达收购。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
苹果创新大模型压缩技术,大模型有机会塞进手机里了索赔1元的“大模型数据被盗第一案”和解;首个生成式AI监管文件正式施行;雷军:小爱同学已升级大模型丨AI周报容器化时代的领航者:Docker 和 Kubernetes 云原生时代的黄金搭档5123 血壮山河之武汉会战 富金山战役 11AVS感知无损压缩标准概述——视觉无损质量等级视频浅压缩8张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍【医学英语】英国老师Sean主讲;课程免费,今晚继续进行《生成式人工智能服务管理暂行办法》实施,8家备案模型生成内容真实性如何?中国科学院团队首篇LLM模型压缩综述:细聊剪枝、知识蒸馏、量化技术大模型时代的程序员:不会用AIGC编程,未来5年将被淘汰?重启与加速,变革期的法律行业【医学英语】英国老师Sean主讲,周六继续进行;本次课程免费凯捷:生成式AI的收获季节:各行业生成式AI的广泛应用微软免费课程、吴恩达开新课,顶级生成式AI必备课程来了【医学英语】英国老师Sean主讲;课程免费,开始预约首富的傲娇和价值观摩根大通内部疯传的估值建模课程,一个字,绝!「附资料包」Adobe推出三个新的生成式AI模型;AMD收购AI软件公司Nod.ai;百度文心生物计算大模型登Nature子刊丨AIGC日报14周硕士级学习,德克萨斯大学奥斯汀分校简明NLP课程视频全公开大型语言模型训练加速专场在线研讨会上线,三位专家将主讲AI服务器、训练框架和云上高性能存储架构生成式 AI 与大语言模型时代的 NVIDIA GPU 生态 | NVIDIA 解决方案与架构技术总监张瑞华演讲预告原创《思考陆扬的“晚唐清流文化”》【医学英语系列】英国老师Sean主讲,本周日晚上8点;本次课程免费【医学英语】英国老师Sean主讲,开始预定;本次课程免费中文在线宣布发布“逍遥”大模型,可一键生成万字小说;谷歌称将保护生成式人工智能用户免受版权索赔丨AIGC日报工作重要,还是妻子重要大模型压缩首篇综述来啦~~英国大学推出Taylorswift课程:明年夏季开班!英国铁路新罢工影响一周!BA.2.86新冠新变种感染广泛传播!GACS 2023 | IPU:赋能生成式AI,不止生成式AI从生成式AI到流媒体,科技时代的好莱坞明星正在失去议价权土耳其索菲亚大教堂贾佳亚韩松团队新作:两行代码让大模型上下文窗口倍增 | GitHub热榜数智商业技术2.0时代的新「三驾马车」,阿里妈妈郑波谈如何把握生成式大模型深度神经网络压缩与加速技术ChatGPT生成虚假数据集以支持科学假设;英伟达助基因泰克用生成式AI加速药物研发丨AIGC日报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。