微软发布基于LLM的代码生成神器,动动嘴就能写代码!
近期,GitHub发布了一个代码生成神器,动动嘴就能写代码,大大减少了手敲代码的工作量。代码生成旨在生成满足特定问题约束的计算机程序,使用大规模预训练语言模型的最新方法已经表现出很强的性能,但它们有一些关键的局限。
9.27-9.28日我们邀请到某大厂AI算法研究员、人工智能博士Kevin 老师给我们带来——基于大模型的文本生成新神器,带你探索Code Generation领域的最新进展!
(文末福利)
导师介绍:Kevin老师
》人工智能博士,某大厂资深AI算法研究员
》在人工智能顶级期刊TPAMI(影响因子24.314)、TNNLS(影响因子14.255),人工智能顶级会议AAAI、CVPR发表过6篇高质量论文,另有多篇论文发表在一区、二区期刊和会议
》研究方向:深度强化学习、自然语言处理、AI 模型优化、通用机器学习模型,通用深度学习模型,生成模型,神经网络搜索等
》在文本生成领域提出了 Dynamic-over-Dynamic 的预训练大模型decoding算法,并将该技术一般化为通用算法框架,使得大语言模型推理文本的质量有了显著提高
课程大纲
免费领导师推荐200篇大模型论文合集
1. 选择合适的语言模型:选择一个适合您任务的大型语言模型,例如T5、GPT-2等。
2. 准备数据:准备一个包含足够数量的文本数据的数据集,以便模型可以从中学习。
3. 训练模型:使用数据集对语言模型进行训练。可以使用无监督学习方法进行训练。
4. 微调模型:如果需要更好的性能,可以使用微调方法对模型进行微调。
5. 生成文本:使用已经训练好的语言模型来生成文本。可以使用给定的前缀或主题来生成特定类型的文本。
6. 评估文本:对生成的文本进行评估,以确定其质量和准确性。
微软这波赢麻了,这次发布的文本代码生成已经给带来实质性的积极的社会影响,例如改造软件开发工具,提高开发人员的生产力,获取高质量的编程课程等等。CodeRL在CodeT5模型的基础上,将深度强化学习引入基于大语言模型的代码生成任务。
其核心创新点有两个:一是利用测试用例训练Critic模型;二是将Critic的应用从训练过程推广到推理过程。这两个核心创新点是CodeRL模型区别于其他代码生成模型的关键。
扫码预约直播(附老师授课PPT)
免费领导师推荐200篇大模型论文合集
(文末福利)
部分大模型/文本生成论文展示
作为一个科研小白,怎么发表一篇优质论文?
为了论文,大家都在努力的设计新网络、新策略、新training算法,只要能够在某一问题上做到一个很好的performance,论文就水到渠成。而想要快速达到,来自前辈的指点不可或缺。
一个好的指导老师的作用是,没有课题,能够结合所在课题组具体情况,结合最近热门研究方向,帮你规划课题,如果有了课题而缺少创新方向,老师能够快速帮你找到几种切入点,几种框架,甚至连需要读哪些文献都帮你想好了......
扫描二维码
与大牛导师1v1meeting
(文末福利)
扫码预约直播(附老师授课PPT)
免费领导师推荐200篇大模型论文合集
(文末福利)
文末福利
恰逢十一黄金周,给大家送福利啦!小沃整理了沃恩智慧联合创始人Paul老师的精品系列付费课程,原价3999元,现0元免费领!包含计算机领域各方向热点内容及论文写作技巧干货!
微信扫码关注该文公众号作者