Redian新闻
>
集中一点,演化无限:PPO × Family决策智能入门公开课即日开讲

集中一点,演化无限:PPO × Family决策智能入门公开课即日开讲

公众号新闻


80,90年代出生的人,红白机总是童年时光重要的记忆片段之一。几叠游戏盒,两个手柄,就可以开启一整天的欢乐时光,乐此不疲地探索各种红白机游戏中的玩法、机制和彩蛋。虽然只是2维平面上的像素头小人,虽然只是「上上下下左右左右BABA」这般的简单按键,但依然被玩家们开发出了各种精彩纷呈的决策行为,时至今日,仍然有很多爱好者在挑战各种诸如「一命通关」、「最速通关」的游戏记录。
 
B站UP主「探索者一九一二」录制的一命通关赤色要塞操作片段

B站UP主「探索者一九一二」录制的一命通关魂斗罗操作片段

而随着时代的发展,游戏类型也变得五花八门,于是玩家们探索的方式也愈加丰富,各类玩家解说攻略视频大大加快了游戏知识的传播速度,还有一系列基于规则的辅助工具将程序和算法引入到游戏探索之中。而到最近几年,人工智能技术的发展更是大大提升了算法探索游戏的极限,从2016年 AlphaGo 在围棋领域技惊四座开始,再到后续2019年的 AlphaStar,OpenAI Five,以深度强化学习为核心的决策AI,在这些复杂度和博弈性最顶尖的游戏中,一次又一次地创造着人工智能的新高峰。

但其实,这些最前沿的决策与智能,离我们并不遥远。在很多人十几二十年前的少年时代,玩家们通过个人自身的练习和尝试,朋友间数不清的讨论与琢磨,探索着这些红白机游戏中的种种玩法,而在当下,其实我们也可以去学习和运用深度强化学习技术,从另一个视角去打造决策智能,解锁各种有趣有成就感的游戏玩法,还可以跳出游戏的圈子,尝试应用到各种各样的日常决策行为,以及各行各业的优化与设计中去。想象一下,你不仅可以训练出一个帮你探索游戏玩法的最佳辅助,又可以拥有一个响应你各种日常指令的机器管家,自主导航和操作完成各种任务。

智能体在 habitat-sim 环境中按照指令执行任务


基于相似愿景,上海人工智能实验室 OpenDILab (开源决策智能平台)将会设计一系列的决策智能公开课。而这个系列的PPO x Family课程会由中国计算机学会主办,上海人工智能实验室承办,全球高校人工智能学术联盟、北京大学人工智能研究院多智能体中心、浙江大学上海高等研究院、商汤科技协办,知乎、机器之心、智海平台、Paperweekly支持。顺利结课的学员还可获得由中国计算机学会颁发的课程学习认证证书。

2022年12月,决策智能入门级公开课PPO x Family将正式线上开课。此课程旨在运用一种最经典的深度强化学习算法 Proximal Policy Optimization (PPO),解决各种各样的决策智能问题,帮助一切对于深度强化学习技术有好奇心的人,轻便且高效地制作应用原型,了解和学习最强大最易用的 PPO x Family。在上完这门课程后,如果有进一步兴趣的话,受众可以将所学知识应用到相关领域中,利用更多的计算资源,去追逐和挑战更强大的人工智能。


PPO 原本是在2017年由 OpenAI 提出的一种深度强化学习算法,而在往后几年中,又有诸多研究者从不同方面给 PPO 添加了许多算法技巧,时至今日,PPO 已成为最受欢迎的算法之一。OpenDILab 总结了各方面研究者们的相关工作,又结合了开源发布一年来,在40多种决策环境中调优和实践的经验和细节,最终凝练而成了这门 PPO x Family 决策智能入门公开课。

本次课程将分为8节线上公开课,每节课40-50分钟。

相对于强化学习领域已有的优秀公开课,这门课并没有选择自顶向下地讲述强化学习发展演变的各个算法分支,而是自底向上地,从实际应用深度强化学习的角度出发,讲述把算法理论应用到实际决策问题时常用的种种分析方法和优化技巧,通过这门课让受众盘清算法理论,理顺代码逻辑,玩转决策AI应用实践。

其中,第1节课将会通过多重对比来讲解决策AI问题定义和研究的特殊之处,第2-7节课将会分别以子领域专题的形式,扩充 PPO x Family 的相关成员,最后一节课,将会综合运用之前累积的各方面知识,去设计和搭建一个「终极」智能体。

更重要的是,每节课程都会保持「算法理论-代码实现-应用实践」三合一的讲解模式,真正做到知其然(代码)又知其所以然(算法),并学以致用(应用)。

算法理论公式和代码实现的一一对应讲解

在 PPO x Family 八节课的过程中,受众会接触到各种各样的决策智能应用,最终结课时,就相当于完成了自动驾驶、量化交易,机器人控制、游戏AI等多个领域相关决策任务的入门实践,从而真正做到集中一点,演化出无限可能。


此外,OpenDILab 也特地优化了每节课的实践任务的计算开销,整个PPO x Family 系列课程并不需要大量计算资源,一定配置的个人电脑完全可以应对各种挑战(当然课程官方也会提供一些免费的计算资源用于备用)。

在上完这门课程后,如果有进一步兴趣的话,受众可以将所学知识应用到相关领域中,利用更多的计算资源,去追逐和挑战更强大的人工智能。而且,这门课程也会在每节课布置一些算法理论分析的小作业,如果能够坚持完成并参与讨论,可以获得由中国计算机学会颁发的课程学习认证证书。

课程预告

目前,OpenDILab已经建立了课程 GitHub相关仓库:
https://github.com/opendilab/PPOxFamily

每一节课程的课件、文字讲稿,代码,答疑等教学素材都会全部公开在这个仓库中。另外,由于剪辑和制作需要,同时响应受众的需求不断优化课程内容,我们将会以每1-2周一节课的速度逐渐更新课程内容,也欢迎大家积极参与贡献,希望能够真正将知识传达给有需要的人,共建知识共享的开源社区。

课程第一讲(开启决策AI探索之旅)将会在 2022年12月8日正式上线。

机器之心将全程同步更新课程,观看地址:https://jmq.xet.tech/s/4wxmuX
扫码观看课程

欢迎大家加入本次课程交流群,课程更新、课后作业、作业提交、证书获取等相关信息将在群中第一时间发布。

扫码即可进群,如已超过人数限制,添加小助手微信(ID:OpenDILab),备注「课程」入群。

Reference:
  • https://github.com/Kautenja/nes-py
  • https://www.bilibili.com/video/BV14d4y1N7KH/?spm_id_from=333.999.0.0
  • https://github.com/facebookresearch/habitat-sim



腾讯生态大会——腾讯云智能专场报名中


  • 腾讯云全新AI架构全景首发

  • 腾讯云 x 埃森哲《数智化转型方法论》发布
  • AI开发新范式:腾讯云TI平台升级发布
  • 热点赛道解读:《数字人产业发展趋势报告》发布
  • 传媒、出行、消费电子等多行业应用实践分享


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
“双减”后,爱孩子就带他做这三件事儿!今晚八点,老师家长一定要看|好老师公开课如何通过古DNA探究人类演化?刘逸宸:古DNA为人类演化带来新见解,不同学科交融深入是必然趋势娄岩一周诗词四首明日开讲 | 大厂在职面试官,破译低迷市场下的面试难点!工信部等四部门公布2022年度智能制造示范工厂揭榜单位和优秀场景名单持续优化无障碍化服务 微众银行微粒贷让金融更有温度Boost Infinite:仅需 $25/月,无限通话短信,无限高速流量,无限国际通话,支持热点让孩子爱上数学的秘密原来在这里!今晚八点,专家来支招!|好老师公开课【广而告之】UIUC新一轮选课即将开始,想转商院和工院的你准备好了吗?!老照片:80年代的纽约入门款AirPods要来了 Apple正开发AirPods Lite考研写作公开课(今晚八点,不见不散)梅根开始和哈里划清界限:哈里自传会影响她从政...早鸟报|蔚来布局百万元级别的电动车;快手电商推出“春节不打烊”活动;2023微信公开课PRO开讲.....B站回应是否考虑推出贴片广告,快递新国标公开征求意见,核子基因厦门公司经营异常,宝沃汽车宣告破产,这就是今天的其它大新闻!广告、流量为王的当下,决策智能如何玩转数智商业场景快乐其实很简单:一点法国的慵懒,一点巴黎的浪漫,再来一点桑贝的幽默感雷军退出多家小米关联公司职务;2023微信公开课PRO线上开讲;任泽平“炮轰”宁德时代……关于毛主席遗体的处置意见第二届搜狐青幕计划大师课即将开启,征片倒计时五天逼近极限:决策接力和宇宙深寒好了一点点,也仅仅是好了一点点点。每长胖一点,你可能就离13种癌症更近了一点!给你一个 PPO × Family 课程,撑起整个决策 AI 宇宙12月29日晚19:30,指南针生物2023国家自然科学基金最新申报技巧特训公开课收官开讲!献礼2023,助大家每投必中~HCSSA 公共服务篇 | 绿卡申请公开讲座突破人类感官极限:你看不见的,听不到的,他带来了|青年 100自体心理学代表「徐钧」老师亲授,55讲入门精神分析四大主流学派之一|今日开课,团购优惠生活的幸福度2023微信公开课PRO开讲:视频号直播将投入50亿流量激励怎样和孩子一起做好时间管理?今晚八点,专家来支招!|好老师公开课浅聊上海百年风情史上海数字大脑研究院发布国内首个多模态决策大模型DB1,可实现超复杂问题快速决策独家采访|如何把握明年APP买量增长机会?4家热门公司都提到了这点决策智能技术浪潮袭来,数智商业领域如何变革?来听听三位专家怎么说
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。