微软发布基于LLM的代码生成神器，动动嘴就能写代码！

公众号新闻

2023-09-26 05:09

近期，GitHub发布了一个代码生成神器，动动嘴就能写代码，大大减少了手敲代码的工作量。代码生成旨在生成满足特定问题约束的计算机程序，使用大规模预训练语言模型的最新方法已经表现出很强的性能，但它们有一些关键的局限。

9.27-9.28日我们邀请到某大厂AI算法研究员、人工智能博士Kevin 老师给我们带来——基于大模型的文本生成新神器，带你探索Code Generation领域的最新进展！

扫码预约直播（附老师授课PPT）

免费领导师推荐200篇大模型论文合集

（文末福利）

部分大模型/文本生成论文展示

导师介绍：Kevin老师

》人工智能博士，某大厂资深AI算法研究员

》在人工智能顶级期刊TPAMI（影响因子24.314）、TNNLS（影响因子14.255），人工智能顶级会议AAAI、CVPR发表过6篇高质量论文，另有多篇论文发表在一区、二区期刊和会议

》研究方向：深度强化学习、自然语言处理、AI 模型优化、通用机器学习模型，通用深度学习模型，生成模型，神经网络搜索等

》在文本生成领域提出了 Dynamic-over-Dynamic 的预训练大模型decoding算法，并将该技术一般化为通用算法框架，使得大语言模型推理文本的质量有了显著提高

课程大纲

第一天：大模型时代的代码生成

介绍大语言模型时代Code Generation领域的最新进展

第二天：代码生成目前的挑战和未来发展

介绍目前文本生成的主要局限和未来较为有潜力的发展方向

扫码预约直播（附老师授课PPT）

免费领导师推荐200篇大模型论文合集

（文末福利）

大模型时代的文本生成微软发布的大模型LLM核心目标是建立一个统计模型，用来估计文本序列中每个词语或字符出现的概率，从而实现语言生成、语言理解等自然语言处理任务！

大语言模型生成内容主要基于语言模型算法。语言模型是一种机器学习算法，它可以根据给定文本来预测下一个词语或字符的出现的概率。语言模型通过大量的文本数据来学习语言的统计特征，进而生成具有相似统计特征的新文本。

CodeRL概览

要利用大型语言模型进行文本生成或创作，可以使用以下方法：

1. 选择合适的语言模型：选择一个适合您任务的大型语言模型，例如T5、GPT-2等。

2. 准备数据：准备一个包含足够数量的文本数据的数据集，以便模型可以从中学习。

3. 训练模型：使用数据集对语言模型进行训练。可以使用无监督学习方法进行训练。

4. 微调模型：如果需要更好的性能，可以使用微调方法对模型进行微调。

5. 生成文本：使用已经训练好的语言模型来生成文本。可以使用给定的前缀或主题来生成特定类型的文本。

6. 评估文本：对生成的文本进行评估，以确定其质量和准确性。

微软这波赢麻了，这次发布的文本代码生成已经给带来实质性的积极的社会影响，例如改造软件开发工具，提高开发人员的生产力，获取高质量的编程课程等等。CodeRL在CodeT5模型的基础上，将深度强化学习引入基于大语言模型的代码生成任务。

其核心创新点有两个：一是利用测试用例训练Critic模型；二是将Critic的应用从训练过程推广到推理过程。这两个核心创新点是CodeRL模型区别于其他代码生成模型的关键。

扫码预约直播（附老师授课PPT）

免费领导师推荐200篇大模型论文合集

（文末福利）

部分大模型/文本生成论文展示

作为一个科研小白，怎么发表一篇优质论文？

为了论文，大家都在努力的设计新网络、新策略、新training算法，只要能够在某一问题上做到一个很好的performance，论文就水到渠成。而想要快速达到，来自前辈的指点不可或缺。

一个好的指导老师的作用是，没有课题，能够结合所在课题组具体情况，结合最近热门研究方向，帮你规划课题，如果有了课题而缺少创新方向，老师能够快速帮你找到几种切入点，几种框架，甚至连需要读哪些文献都帮你想好了......

扫描二维码

与大牛导师1v1meeting

（文末福利）

扫码预约直播（附老师授课PPT）

免费领导师推荐200篇大模型论文合集

（文末福利）

文末福利

恰逢十一黄金周，给大家送福利啦！小沃整理了沃恩智慧联合创始人Paul老师的精品系列付费课程，原价3999元，现0元免费领！包含计算机领域各方向热点内容及论文写作技巧干货！

立即扫码

免费领沃恩智慧创始人精品系列课程

-END-

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章