Redian新闻
>
AutoDev:AI 突破研发效能,探索平台工程新机遇

AutoDev:AI 突破研发效能,探索平台工程新机遇

科技

围绕于探索 AI 对软件研发的影响,并在有了 LLM 微调工程化能力之后,我们上周末又开源了一个适用于 AI 研发提效的工具:AutoDev。如此一来,我们便构建了接近完整的 AI 在研发效能提升。

在这篇文章中,我们将基于 Unit Mesh、DevTi、AutoDev 等一系列的探索,分享 AI 对于研发效能的影响,以及对于平台工程带来的新机遇。

PS:整个体系站在一个基本假设是:中大型企业将至少拥有一个私有化的大语言模型。

GitHub: https://github.com/unit-mesh/auto-dev

引子 1:DevTi = 软件开发工程化 + LLM 微调

DevTi(Development + Titanium)一款基于大语言模型的研发效能提升的开源项目。旨在基于 LLM 的微调来提供全面智能化解决方案,助力开发人员高效完成开发任务,以实现自动化用户任务拆解、用户故事生成、自动化代码生成、自动化测试生成等等。

简单来说,DevTi 是 AI + 研发效能领域的小模型的工具链 —— 借助于 DevTi,你可以快速训练出适用于软件研发的微调模型。一个简化的流程,如下图所示:

为了进行相关的模型微调或者训练,在其中的每一个阶段里,我们都需要准备数据、处理数据、生成 prompt 等,如准备一系列的用户故事、代码生成的数据。所以,作为工程师,需要准备一系列的编程基础设施或者模块。

DevTi 所包含的模块如下所示:

它包含了 4.5 个模块:

  • Collector(Python, JavaScript),数据收集。这个模块负责从不同的数据源(如 GitHub、Stack Overflow、CodePen 等)收集代码片段、问题、答案等数据,以便用于微调。

  • Processor(Kotlin),数据处理。这个模块负责对收集到的数据进行清洗、格式化、标注等预处理操作,以提高数据质量和一致性。

  • Prompter(Python),Prompt 设计、调整、优化等。这个模块负责根据用户的需求和场景,设计合适的 Prompt 来引导大语言模型生成期望的输出,例如用户故事、代码片段、测试用例等。

  • Train(Python),训练相关的 Notebook。这个模块包含了一些 Jupyter Notebook 文件,用于展示如何使用不同的大语言模型微调(如 ChatGLM、LLaMA等)来完成不同的研发任务,例如代码生成、代码补全、代码注释等。

  • Chain。待定

随后,便可以围绕于 DevTi 构建工具链,如 IDE 工具、看板工具等等。

引子 2:AutoDev = IDE 插件 + AI API 调用

AutoDev 是一款高度自动化的 AI 辅助编程工具。AutoDev 能够与您的需求管理系统(例如 Jira、Trello、Github Issue 等)直接对接。在 IDE 中,您只需简单点击,AutoDev 会根据您的需求自动为您生成代码。您所需做的,仅仅是对生成的代码进行质量检查。

简单来说,AutoDev 定位是适用于私有化大语言模型 + 高度集成的 AI 编程助手。AutoDev 提供了一种 AutoCRUD 模式,其设计理解的过程是:

  1. 从需求管理系统获取需求,并进行需求分析。

  2. 结合源码与需求系统,选择最适合变更的入口(如 Java 中的 Controller)

  3. 将需求与 Controller 交给 AI 分析,以实现代码的代码。

  4. 根据 Controller 逐步自动完成其它部分代码(实现中…)

另外一种模式则是普通的 Copilot 模式,可以接入现有的大模型工具,实现一系列的 AI 代码辅助相关功能。

GitHub: https://github.com/unit-mesh/auto-dev

接入 LLM,我们不仅可以生成代码,还可以生成单元测试代码,从而提高测试效率和覆盖率。

让我们再展开看一看,基于现有的 AI 能力,会有哪些新可能性。

平台工程的变化与新机遇

而除了我们上述的 demo 之外,我们相信它带会其它带来一系列的变化。对于中大型组织的基础设施或者平台团队来说,要接入 AI 能力需要有更多的变化与机遇。

平台工程是一种用来构建和运维支持软件交付和生命周期管理的自助式内部开发者平台的机制和架构。平台工程可以提高开发者的体验和生产力,提供自动化的基础设施操作。平台工程是软件工程组织的新趋势,它可以优化开发者的工作流程,加速产品团队交付客户价值。

平台工程的核心思想是将平台视为一种产品,由专业的平台团队来创建和维护,为内部的客户(如开发者、数据科学家等)提供可复用的服务、组件和工具。

需求:自动化收敛、分析与完善

在现有的 AI 能力之下,已经有一系列的关于结合 AI 进行需求管理的尝试:

  • 自动化完善。对用户的反馈和数据的分析,自动识别和补充缺失的需求信息,例如自动识别用户提出的问题并转化为需求描述,自动补全需求的关键词和标签等。

  • 自动化分析。通过训练自带的领域知识,可以更好地评估和优化需求,发现潜在的问题和机会,提高需求的效率和效果。

  • 自动化收敛。结合其它 AI 技术,比如智能推荐、对话系统、多方协作等,可以帮助您更好地沟通和协调需求,收集和整合用户的反馈和痛点,提高需求的满意度和一致性。

  • 自动化迭代。结合人类反馈的 AI 数据,可以更好地更新和改进需求生成,适应不断变化的环境和用户需求,提高需求的持续性和创新性

尽管现有的几个方案:LangChain、llama-index 等暂时只支持 OpenAI,但是随着更多开源大语言模型的加入,未来会更易于落地。

工具链:智能的 IDE

对于现有的场景来说,已经相当的丰富,诸如于:

  • 自动化代码审查

  • 自动化测试

  • 自动化日志分析

  • AI 辅助编程

  • ……

诚然,诸如于 GitHub Copilot 等收费 AI 工具来说,对于大部分公司来说,贵可能是其次,重点是代码的安全性。而虽然国内各类新的模型层出不穷,但是大部分缺少编程相关的集成,又或者是编程能力比较弱。然而,市面上也有只用于编程相关的模型,如 Salesforce 在 Hugging Face 上提供的 16B CodeGen 模型。虽然,还需要经过一些小的微调,但是如 Replit 公司所言,效果还是非常不错的。

随后,便是类似于 AutoDev 针对于大语言模型进行的封装,简化普通开发人员的开发过程。

文档:超越搜索

在有了 LLM 和各种智能问答的基础上,我们还可以加入内部各种工具的文档和代码,以提供更全面、更智能的文档服务。例如,LangChain 构建的问答式文档,可以对企业内部的各种文档进行语义理解和智能问答,进而简化开发人员的学习成本。

其它

AI 正在带来一系列的变化,特别是对于中大型企业的平台工程团队来说,接入 AI 能力需要有更多的变化与机遇。例如,可以自动化收敛、分析与完善需求,构建智能的IDE,提供更全面、更智能的文档服务等。

我们依旧在探索中,欢迎来加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
在线会议:由MG诊治最新诊疗l进展,探索自身免疫性疾病的临床研发思路围观魏牌蓝山DHT-PHEV:最好的家用SUV,不止一个?专访交纳智能崔大祥:纳米呼气诊断突破性技术,开辟胃癌早筛领域新机遇LLM 赋能的研发效能:如何探索软件开发新工序?平台工程和DevOps并不矛盾对话胡润U30 | 本盛资产管理总经理邱光星:以学生角度探索VR教育新机遇40年难遇GPT时代?这是人人都能抓住的编程新风口 | 极客时间通用电气在平台工程上浪费 70 亿美元的教训SpringBoot 中的自带工具类,开发效率增加一倍!细胞外囊泡与药物研发专场 | 聚焦外囊泡递送技术与新药研发!2023EVS大会论坛三日程出炉!Unity年度游戏研发洞察报告:跨平台成趋势,研发期6-18个月项目最多一个价值70亿美元的教训!如何避免平台工程变成“大灾难”?陈冲:我们将死于梦醒腾讯中台Rui Su:CROS行云,如何帮助超100款游戏提升研发效率40年难遇GPT时代?大模型API集体开放,人人都能抓住的编程新风口!| 极客时间【友情转发】BioFuture|对话诺贝尔生理学或医学奖得主Randy Schekman,探寻生命科学新机遇安达卢西亚的秋阳下~科尔多瓦通用电气在平台工程上浪费70亿美元的教训提升字节规模化效能的平台化思路|字节跳动平台工程实践基于 KubeVela 实践应用交付的平台工程新玩法 | 极客有约Conagen和Natáur达成合作,生产可持续天然牛磺酸艺人啥时候成了道德标杆了?Cape Cod -- South Yarmouth疗养院爆发 COVID 疫情,造成 5 人死亡,超过 90 人感染Royal Albert的历史平台工程和ChatGPT会让运维们失业吗?友情推送 | BioFuture | 对话诺贝尔生理学或医学奖得主Randy Schekman,探寻生命科学新机遇平台工程理念崛起,DevOps 会被取代吗?领英通过实施消息客户端 SDK,将开发效率提高了 10 倍平台工程不适合中国企业?这个观点值得反驳!平台工程应知应会明度科学平台发布!AI赋能药物研发效率与合规,提供灵活组合的数智化解决方案摘要提交截至6月9日Cell Symposia日程新鲜出炉丨肥胖的分子机制和整合生理学刚刚!澳洲逆天突破研究:可能彻底终结新冠!你来问我怎样才能写出好文章?MyBatis-Plus 可视化代码生成器来啦,让你的开发效率大大提速!!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。