Redian新闻
>
微软发布基于LLM的代码生成神器,动动嘴就能写代码!

微软发布基于LLM的代码生成神器,动动嘴就能写代码!

公众号新闻

近期,GitHub发布了一个代码生成神器,动动嘴就能写代码,大大减少了手敲代码的工作量。代码生成旨在生成满足特定问题约束的计算机程序,使用大规模预训练语言模型的最新方法已经表现出很强的性能,但它们有一些关键的局限。


9.27-9.28日我们邀请到某大厂AI算法研究员、人工智能博士Kevin 老师给我们带来——基于大模型的文本生成新神器带你探索Code Generation领域的最新进展!


扫码预约直播(附老师授课PPT)
免费领导师推荐200篇大模型论文合集

(文末福利)


部分大模型/文本生成论文展示

导师介绍:Kevin老师




》人工智能博士,某大厂资深AI算法研究员

》在人工智能顶级期刊TPAMI(影响因子24.314)、TNNLS(影响因子14.255),人工智能顶级会议AAAI、CVPR发表过6篇高质量论文,另有多篇论文发表在一区、二区期刊和会议

》研究方向:深度强化学习、自然语言处理、AI 模型优化、通用机器学习模型,通用深度学习模型,生成模型,神经网络搜索等

》在文本生成领域提出了 Dynamic-over-Dynamic 的预训练大模型decoding算法,并将该技术一般化为通用算法框架,使得大语言模型推理文本的质量有了显著提高



课程大纲




第一天:大模型时代的代码生成
介绍大语言模型时代Code Generation领域的最新进展
第二天:代码生成目前的挑战和未来发展
介绍目前文本生成的主要局限和未来较为有潜力的发展方向
扫码预约直播(附老师授课PPT)

免费领导师推荐200篇大模型论文合集


(文末福利)


大模型时代的文本生成微软发布的大模型LLM核心目标是建立一个统计模型,用来估计文本序列中每个词语或字符出现的概率,从而实现语言生成、语言理解等自然语言处理任务!
大语言模型生成内容主要基于语言模型算法。语言模型是一种机器学习算法,它可以根据给定文本来预测下一个词语或字符的出现的概率。语言模型通过大量的文本数据来学习语言的统计特征,进而生成具有相似统计特征的新文本。

CodeRL概览
要利用大型语言模型进行文本生成或创作,可以使用以下方法:

1. 选择合适的语言模型:选择一个适合您任务的大型语言模型,例如T5、GPT-2等。

2. 准备数据:准备一个包含足够数量的文本数据的数据集,以便模型可以从中学习。

3. 训练模型:使用数据集对语言模型进行训练。可以使用无监督学习方法进行训练。

4. 微调模型:如果需要更好的性能,可以使用微调方法对模型进行微调。

5. 生成文本:使用已经训练好的语言模型来生成文本。可以使用给定的前缀或主题来生成特定类型的文本。

6. 评估文本:对生成的文本进行评估,以确定其质量和准确性。



微软这波赢麻了,这次发布的文本代码生成已经给带来实质性的积极的社会影响,例如改造软件开发工具,提高开发人员的生产力,获取高质量的编程课程等等。CodeRL在CodeT5模型的基础上,将深度强化学习引入基于大语言模型的代码生成任务。

其核心创新点有两个:一是利用测试用例训练Critic模型;二是将Critic的应用从训练过程推广到推理过程。这两个核心创新点是CodeRL模型区别于其他代码生成模型的关键。


扫码预约直播(附老师授课PPT)

免费领导师推荐200篇大模型论文合集

(文末福利)


部分大模型/文本生成论文展示


作为一个科研小白,怎么发表一篇优质论文?

为了论文,大家都在努力的设计新网络、新策略、新training算法,只要能够在某一问题上做到一个很好的performance,论文就水到渠成。而想要快速达到,来自前辈的指点不可或缺。

一个好的指导老师的作用是,没有课题,能够结合所在课题组具体情况,结合最近热门研究方向,帮你规划课题,如果有了课题而缺少创新方向,老师能够快速帮你找到几种切入点,几种框架,甚至连需要读哪些文献都帮你想好了......

扫描二维码

与大牛导师1v1meeting

(文末福利)



扫码预约直播(附老师授课PPT)

免费领导师推荐200篇大模型论文合集

(文末福利)

文末福利

恰逢十一黄金周,给大家送福利啦!小沃整理了沃恩智慧联合创始人Paul老师的精品系列付费课程,原价3999元,现0元免费领!包含计算机领域各方向热点内容及论文写作技巧干货!




立即扫码
免费领沃恩智慧创始人精品系列课程

-END-

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
代码生成:基于 AI 大模型的挑战与前景移民生活(20)理性和信仰的困境(之一)GPT-4,Llama2,ChatGLM2,PaLM2共聚一堂 | LLM Day @KDD 2023训练14分钟,超越Alpaca!华人团队发布「飞天羊驼」,基于LLM的数据过滤新范式一篇关于LLM指令微调的综述Medusa: 简单高效地解决LLM的生成延迟大模型掌握16000+真实世界API了,清华等机构ToolLLM的工具使用能力不输ChatGPT开源打败闭源?Meta即将推出开源代码生成平台Code Llama,剑指OpenAI Codex不用4个H100!340亿参数Code Llama在Mac可跑,每秒20个token,代码生成最拿手|Karpathy转赞80% 代码秒生成!AI 神器 Copilot 大升级,百万开发者动嘴编码 5 年内成真任意场景,动嘴就能创建专属AI智能体小队的AutoAgents来了迪斯尼乐园里面的 Club 33不用LLM,遗传编程可控Python代码!谷歌DeepMind等提出全新ARZ框架|IROS 2023苹果进入中国30周年 / Meta 将推出自动代码生成软件 / 视觉中国索赔事件进展 | 灵感周报全球首个大模型Agent产品爆款出场!动动嘴让PC成为打工人一人独占百元大奖?!约克论坛福利日又双叒叕来啦,动动手指,下一个幸运儿就是你~不动嘴是罪人,动手是傻子开源打败闭源?Meta 即将推出开源代码生成平台 Code Llama,剑指 OpenAI CodexChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力GPT-4、ChatGLM2、Llama2、PaLM2在KDD LLM Day上一起开了个会Stability AI进军编程领域,发布首个用于代码生成的大语言模型港大&百度提出LLMRec:基于LLM增强的多模态图神经网络推荐探索 prompt 编码范式:如何优雅构建测试代码生成提示词?陈丹琦新作:一个LLM的评估基准LLMBarGoogle DeepMind 宣布基于 LLM 的机器人控制器 RT-2ChatGPT 是 ENTJ,GPT4 竟是 INTJ?一项关于LLMs的MBTI测试vivo 发布基于 Rust 的操作系统,全球首款?字节跳动宣布除夕统一放假;大妈招女婿要求大模型从业人员 | Q资讯代码数据会促进LLM的推理能力吗?80%代码秒生成!AI神器Copilot大升级,百万开发者动嘴编码5年内成真红色日记(1964.6.12-14)谷歌打造「终结者」!ChatGPT版最强机器人AGI,动嘴操控007OpenAI祭出绘画神器,Midjourney一夜下台!DALL·E 3联手ChatGPT,无需prompt一笔成神0.2美元微调就能让ChatGPT彻底破防!普林斯顿、斯坦福发布LLM风险预警:普通用户微调也影响LLM安全性热风不识字 随意乱翻篇人民公仆洪森牺牲自己传位儿子
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。