Redian新闻
>
字节跳动如何在单元测试中落地大模型|QCon

字节跳动如何在单元测试中落地大模型|QCon

公众号新闻

单元测试是保障项目可靠性的重要手段。然而,传统的智能单测生成方法存在着对多种编程语言重新适配、依赖静态分析和动态分析工具的问题。但大模型出现后,另一种令人振奋的解决方案来了。

随着模型参数规模的提升,大模型在代码理解和代码生成能力方面取得了巨大的进步,为单元测试带来了全新的可能性。端到端的生成方式可以低成本地将单元测试覆盖到多种编程语言中,为项目提供可靠性保障。然而,在大模型助力智能单测生成的过程中,仍然存在模型幻觉和测试分支覆盖不全的问题。

为解决以上问题,字节跳动算法专家张树波的团队发现通过任务微调、强化学习等技术可以提升语言模型的单元测试生成语法正确率和分支覆盖率。经过测试,他们的 70 亿参数模型的生成效果不弱于通用版 ChatGPT 的水平,并且在低端显卡上的推理时延只有 ChatGPT 的 25%。且目前大模型单元测试生成分支覆盖率在实际项目中达到 56%,同时在抖音的 Android、iOS 双端落地,问题有效性达到 80%,修复率 65%。

在今年 9 月 3-5 日举办的 QCon 全球软件开发大会·北京站中,张树波将把以上经验分享给大家。他硕士毕业于清华大学,先后就职于 vivo、字节跳动,从事 NLP 算法多年,在智能单测、智能客服、语音助手等业务场景有丰富的落地经验。

在本次演讲中,他将首先介绍单元测试的背景和其在软件开发中的重要性,并提出评估单元测试生成效果的指标,以便更好地衡量生成结果的质量和覆盖范围。

接着介绍传统的单测生成方法,包括依赖静态分析和动态分析等工具。传统方法在面对多种编程语言时需要进行适配,并存在一些局限性和挑战。

随后,他将结合大模型基座介绍与对比、Prompt 对单测生成的影响、代码理解、生成能力评估、测试用例生成能力评估和通用模型存在的问题等几方面介绍他们是如何评估通用大模型的单测生成能力的。随后介绍如何通过任务微调提升分支覆盖率和强化学习缓解模型幻觉问题以达到提升大模型单测生成效果的目的。

最引人入胜的是大模型落地工程实践的部分,这部分包含大模型微调框架开发和大模型推理优化实践两个部分。

最后,他将分享大模型在单元测试生成领域的应用落地情况,与听众共同探讨大模型在提升软件开发效率和质量方面的潜力,并探讨未来发展的可能性。

如果你也对大模型如何助力智能单测生成从而提升项目的可靠性感兴趣,这个演讲一定不要错过。

活动推荐

以「启航·AIGC 软件工程变革」为主题的 QCon 全球软件开发大会·北京站将于 9 月 3-5 日在北京•富力万丽酒店举办,此次大会策划了大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、大前端融合提效、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近 30 个精彩专题。

现在购票即可享受 8 折优惠,立减 ¥1760。咨询购票可联系票务经理 18514549229(微信同手机号)。点击「阅读原文」即可查看专题详情,期待与各位开发者现场交流。  

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
从 0 到 1 精益创新 AIGC 产品应用及商业化落地的 4 个关键|QCon“白蛇传”说不清的前世今生美团如何从 0 到 1 构建集群服务质量运营体系降低云成本|QCon使用 GoogleTest 和 CTest 进行单元测试 | Linux 中国大模型爱好者必看:60+大模型全场景落地案例集|QCon构建大模型生态基础设施,你选 Python + Docker 还是 Rust + WebAssembly?| QCon单元测试3.0实践之Golang质量生态建设5个关键问题让单元测试的价值最大化爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯大模型颠覆研发模式:字节跳动是如何在单元测试中落地大模型的?世界文化遗产,无城管,中大奖AI大模型如何在行业实际落地:企业对话场景拥抱大模型之路从文心一言 APP 看大语言模型时代的 C 端产品研发变革|QConSOFAServerless 应用架构助力业务10倍效率提升,探索微服务隔离与共享的新平衡|QCon字节跳动向大模型大乱斗扔出一个豆包叶诚尘该死吗谈谈如何使用好单元测试这把武器减$100!奥兰多4-9日游含门票:迪士尼、环球影城、海洋世界、十三大主题乐园任选!肯尼迪航天中心/墨西哥湾 QC4-QC9北京/上海内推 | 字节跳动平台治理算法团队招聘NLP大模型/多模态算法实习生百度技术天团即将集体亮相 QCon 北京,分享大模型相关技术实践只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型Copilot Chat 推出公开测试版,GitHub:花费数月的单元测试成为过去薪水透视眼 | 2023年字节跳动各岗位薪水(算法/数分/产品/运营/前端/后端/销售/测试)新计算范式下,Databricks、Snowflake、Doris、字节跳动的数据平台落地实践|QCon传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报Byzer,一种大模型时代的SQL 编程语言|QCon60岁生日之行(1):到达与庆祝大模型挑选指南来了!涵盖六种情况下的选择方案,为你匹配最佳模型|来自沃顿商学院教授SaaS + AIGC 产品化,与客户互相启发的内测过程与案例|QCon掘墙者智能周报|OpenAI收购一家游戏制作公司;稚晖君发布人形机器人「远征 A1」;字节跳动测试多个类ChatGPT产品...字节跳动开源ByConity:基于ClickHouse的存算分离架构云原生数仓案例分享:混部共享集群租户内自定义调度编排数据密集型Serverless应用|QCon字节跳动 Al Lab、北京大学、华盛顿大学、加州大学学洛杉矶分校知名学者重磅来袭!早鸟报|淘宝更改销量展示规则;字节跳动回应AI对话产品豆包上线;快手公布自研大模型最新进展...
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。