QCon北京2023 参会见闻:大模型时代的技术人成长
我目前致力于操作系统相关的研发, 公司的目标是打造物联网时代的智能原生操作系统。如何实现操作系统的 AI Native 呢?带着这样的疑问我参加了 QCon 北京 2023 的大会。与 QCon 北京 2022 不同的是, 身份变了, 上次是分享者, 这次是出品人, 出品的专题是——大模型时代的技术人成长。
在大模型时代, 技术人如何成长呢?划分为 3 个话题:
大模型时代的特点是什么?对个人提出了哪些新的要求?我们如何应对?
大模型时代新的开发范式是什么?通过新的开发范式,我们可以发现哪些新的机会?并如何去把握这些新机会?
对我们已有的业务, 如何通过大模型为其赋能?在应用大模型相关技术的时候,我们又应该注意些什么呢?
三位分享的老师非常给力,三场演讲的效果在一定程度上达到了预期,因为现场还是出现了站票的同学。
首先登台的是首都在线的吴锦晟老师,话题是大模型时代下的个人成长。
从国内大模型的发展开始, 重点谈到了大模型的核心能力——涌现
Translation 60B
Math 60B
In-context Learning 130B
Chain-of-thought reasoning 130B
Knowledge combination 530B
Emotion Perception 530B
进而讲到了应该了解的一些常见应用场景——
面对大模型,对我们的技术体系提出了新的要求,例如:
每个人都是独立的个体, 都应该根据自己的条件有着自己的思考。
如果时间充裕一些, 随着技术成长相关话题的展开, 我认为肯定可以给大家带来更多的帮助。
第二场分享对应着我们的第二个问题,但在会前我收到宜博老师的 PPT 时,我被惊到了,159 页的讲稿对于我们的专场 45 分钟简直是不能完成的任务。感谢宜博老师的大幅裁剪,现场的版本是精简版定制播放。
分享中以大量的落地场景开始,让我们了解到大模型不再是坐而论道,除了 ChatGPT 之外,基于大模型的应用已经在我们身边落地生花了。
大模型训练有三个要素:数据集数量,训练强度和参数,人与 AI 的协同模式同样有三种:Embedding、Copilot 和 Agent,但重要的还是开发范式的变化。
宜博老师深入浅出地讲解了大模型开发范式的 6 个层次,并以 LLMFarm 为例阐述了如何应用这一方式开发我们的 AI App。
其中的第一性原理是:AI First 就是没有大模型就不成立的应用。
给高瞻远瞩的你三个建议
最后登台的是老朋友一乐,蓝莺 IM 在大模型火爆之前就已经是一款很不错的产品了,那么大模型又为这样一款 IM 产品赋能了什么呢?
一乐认真地分享了应用大模型中所遇到的挑战:⼤模型能⼒涌现需要⼤参数,以及胡编乱造的⼤模型⽆法解释,以及使用大模型服务的三种模式——PromptOnly,Embedding 和 Fine-tune。重要的是,指出了大模型应用中的常见错误观点:
进而,一乐给出了三点建议:
建议一:有出海的勇⽓,也要有冷静的思考
建议二:AI First,也要 AI Right
建议三:看得远才⾛得远,⾛⼀步看三步
蓝莺 IM 应用大模型的示例贯穿始终,包括让人眼前一亮的知识库联邦架构——
三场演讲,内容都是相当的充实,导致我只能被迫压缩互动环节,每一场分享都留下了些许的遗憾。
感谢各位老师的大力支持, 本专题所有讲稿 PPT 都是开放的, 感兴趣的朋友可以到 QCon 北京 2023 的大会官网——大模型时代的技术人成长专题下载所有讲稿(https://qcon.infoq.cn/202309/beijing/schedule),有问题可以留言或者与老师们直接联系。
意犹未尽,青山不改,后会有期!
FCon 全球金融科技大会将于 11 月在上海开幕,会议聚焦当前金融行业遇到的问题,围绕金融企业在数字化转型过程中的痛点,例如数据治理,智能化、数字化风控,数字化投研,数字化营销,IT 技术能力等方向进行深入交流,扫码或点击「阅读原文」可查看全部演讲专题。
前 100 人可享 5 折特惠购票,咨询购票请联系:17310043226(微信同手机号)。
微信扫码关注该文公众号作者