大模型只是起点:朝向多智能体和人类紧密协作的未来|戴雨森对话吴翼
用声音,听见真格。
「此话当真」是一档泛商业类播客,我们希望搭建这样一个分享和交流的平台,让每一个对商业、科技、创投充满好奇的人都能在这里有所收获。每期播客将会由不同的真格投资人担任主持,和各领域的领军人物一起带大家深入了解科技趋势,以及创新技术的影响力。交流科技热点,我们只想给你最专业的解读。
当然,我们希望这不仅仅是一个播客,更是一次创业的探索。真格,你的创业第一站!我们期待与你相遇,一同发现新的可能。
节目内容
在 OpenAI 的 YouTube 官方账号里,一个小红人追着小蓝人玩捉迷藏游戏的视频有最高的点击率。
在强化学习算法下,小红和小蓝这些 AI 小人在虚拟世界里面不停玩游戏,一开始的小蓝只会躲,在日夜重复玩了上万轮之后,它们开始发现策略、学会协作、甚至反制。
第一期节目,我们邀请到了清华大学交叉信息研究院助理教授吴翼,他也是捉迷藏游戏的团队成员之一。在 2022 年回国任教前,他曾在 OpenAI 工作了一年半的时间。在他现在的办公室里,有意思的 AI 实验还在发生,有的训练 AI 玩游戏,有的指挥机器狗追小球,而这些共同的目的是想做一个能与人交互的通用AI。
在本期播客,你将听到真格基金管理合伙人戴雨森与清华大学交叉信息研究院助理教授吴翼探讨:学术界与工业界之间、中美公司之间研究 AI 的区别在哪里?为什么将游戏作为 AI 的研究对象?机器人的 GPT-3 时刻是什么?ChatGPT 对机器人有什么帮助?如何考虑 AI 的安全与对齐问题?
01:59 打游戏,指挥机器狗追小球,吴翼的团队正在做什么
03:42 ChatGPT 不能把事情全做完,它只是起点
10:46 OpenAI 的研究方式不同于传统的学术界和工业界
11:53 如何看待 OpenAI 从非盈利组织转为盈利性公司?
14:45 字节会做出中国领先的大模型吗?
17:38 AI 喜欢研究游戏,因为游戏是足够复杂的模拟世界
30:31 机器人的 GPT-3 时刻:机械手拧魔方
38:28 AI 可以写小说、玩游戏,但做不到给你递一杯咖啡
50:27 给大模型加一些不确定性,防止它自信地胡说八道
55:11 未来人们的工作可能都在为 AI 创造数据
58:40 吴翼最近在筹备的创业团队
如果你对节目有任何的建议与期待,欢迎在留言区互动~
如果你有任何的创业想法或是有合作的想法,欢迎发邮件到 [email protected]!
相关资料
吴翼清华主页
🔗 https://iiis.tsinghua.edu.cn/zh/wuyi/
捉迷藏游戏 Multi-Agent Hide and Seek
🔗 https://www.youtube.com/watch?v=kopoLzvh5jY
微信扫码关注该文公众号作者