- 可执行单元校验:在 IDE 中提升 AI 智能体代码的准确性
在开发 IDE 插件 AutoDev 时,我们一直遵循着 Unit Mesh 的基本思想,即 AI 所生成的应该是可执行的单元(Unit)。在底层构建丰富的各类单元/工具, 再结合 DevIns 来构建强大的智能体能力。在初步完成了 AutoDev 的整体蓝图(MVP)之后,我们开始强化原来的准确性
- 我们是如何在 IDE 中设计 AutoDev 的 AI 编程开发智能体语言与框架?
上周微软发布了自家的 AI 编程和软件开发智能体框架:AutoDev,其与我们开发的 IDE 插件 AutoDev 有颇多的相似之处,特别是一些设计思路,以及在对于辅助软件开发任务的智能体以及一些基础设施上。稍有不同的是:交互介质。我们的 AutoDev 构建基于 IDE API 体系构建的,而微软
- 软件复杂性的协同:AI 工具应如何与人类协作解决软件开发任务?
在设计 Unit Mesh 架构时,其思想是以 Unit(如代码单元)作为 AI 辅助生成的元素,以辅助人类解决复杂的软件开发问题。围绕于 Unit Mesh 的理念,在 AutoDev 1.6.0 版本中,我们开发了更多的生成 “单元” 的功能:生成 React 前端单个组件、页面的:AutoPa
- 编码数据集生成框架 UnitGen 0.4.0:代码文档生成、测试代码生成
UnitGen 是我们从 UnitEval 拆分出来的代码数据集生成项目,旨在为基于开源模型供的私有化部署提供更好的编码数据集。在结合开源模型 + AutoDev 插件之后,你可以使用 UnitGen 结合企业内部现有的代码生成微调数据集,以让模型生成的代码更适合组织内部的需要,提升开发人员效率。G
- AutoDev Coder 6.7B 代码微调模型(v1 试验版)
太长不读性:适用于 AutoDev 的编码大模型 AutoDev Coder 6.7B 第一个勉强可用的版本出来的。HuggingFace 首页:https://huggingface.co/unit-mesh (暂时没有资质提供模型,🐶🐶)。数据集下载地址:https://huggingface.
- AI 助手背后的体验设计:从AI辅助写作和编程的增强说起
在过去的一年里,越来越多的生成式 AI 应用来到了我们的日常,Copilot 似的 AI 大大改善了我们的工作和生活体验。而作为工程师,仅仅使用 AI 工具是不合时宜的,在恰当的时候,加入 AI 原生应用的开发大军,才是更适合被誉为 “夕阳产业” 从业人员的一种选择。而从我们构建 ClickProm
- Team AI:简化繁琐日常任务,打造团队智能协作
在过去的几个月里,我的同事们(Thoughtworker)一直在构建 Team AI 项目,一个围绕于 AIGC 辅助开发团队的野心勃勃的计划。在内部,我们还有一个名为 Team AI Hackathon 的活动,基于一个内部的 Team AI 代码库,探索构建适合于不同软件研发团队的 Team A
- AutoDev 1.4 规模化 AI 研发辅助:团队 Prompts、自定义活文档、代码检视
在过去的两个月里,随着 Thoughtworks 内部的大规模 AI 辅助软件交付(AI4SoftwareDelivery)的展开 —— 在全球,有上千名的 Thoughtworker 这一个涉及不同角色、不同地区,以及几十场内部分享的活动。我们也在 AutoDev 加入了更多的新特性,以持续探索如
- Prompt 驱动架构设计:探索复杂 AIGC 应用的设计之道?
你是否曾经想过,当你在 Intellij IDEA 中输入一个段代码时,GitHub 是如何给你返回相关的结果的?其实,这背后的秘密就是围绕 Prompt 生成而构建的架构设计。Prompt 是一个输入的文本段落或短语,用于引导 AI 生成模型执行特定的任务或生成特定类型的输出。不同的 Prompt
- PromptScript:轻量级 DSL 脚本,加速多样化的 LLM 测试与验证
TL;DR 版本PromptScript 是一个轻量级的 Prompt 调试用的 DSL (Yaml)脚本,以用于快速使用、构建 Prompt。PromptScript 文档:https://framework.unitmesh.cc/prompt-scriptWhy PromptScript ?几
- 如何设计一个 JVM 语言下的 LLM 应用开发框架?以 Chocolate Factory 为例
本文将介绍 Chocolate Factory 框架背后的一系列想法和思路。在我们探索和设计框架的过程中,受到了:LangChain4j、LangChain、LlamaIndex、Spring AI、Semantic Kernel、PromptFlow 的大量启发。欢迎一起来探索:https://g
- 当大模型不是问题时,如何应对 LLM 的工程化落地挑战?
几个月前,在 Thoughtworks 的内部 AIGC 研讨会里,我们一直达成了一系列一致观点,诸如于:如果没有 “开源模型” 降低企业应用 LLM 的成本,那么 LLM 会很快消亡。所以,我们相信开源 LLM + LoRA 微调会成为企业的一种主流方式。现今,我们可以看到 LLaMA 2、Cod
- CoUnit:探索 LLM 即团队接口人,释放平台团队生产力
在那篇《LLM as Co-integrator:重塑团队间交互,持续改进信息对齐》里,我们说道,为了更好的利用 AIGC 提升效能,我们的第二个阶段应该是:让 LLM 做一些协同工作,诸如于:构建多场景知识问答,降低知识检索成本、设计团队 API,打造智能助理。于是,我们着手构建了 CoUnit,
- AutoDev 1.1.3 登场,个性化 AI 辅助:私有化大模型、自主设计 prompt、定义独特规则
在过去的半个月里,我们为开源辅助编程工具 AutoDev 添加了更强大的自定义能力,现在你可以:使用自己部署的开源大模型自己配置 Intellij IDEA 中的行为自定义开发过程中的规范当然了,如果您自身拥有开发能力的话,建议您自己基于 AutoDev 定制。毕竟,为 AutoDev 添加太多的自
- LLM as Co-pilot:AutoDev 1.0 发布,开源全流程 AI 辅助编程
四月,在那篇《AutoDev:AI 突破研发效能,探索平台工程新机遇》,我们初步拟定了 AI 对于研发的影响。我们有了几个基本的假设:中大型企业将至少拥有一个私有化的大语言模型。只有构建端到端工具才能借助 AI 实现增质提效。围绕于这些假设,我们开始构建 AutoDev,将并将它开源。也在我的博客里
- 探索 prompt 编码范式:如何优雅构建测试代码生成提示词?
从四月份到现在,我们持续为 AutoDev 编写了一系列的功能。尽管开发了三个多月,我们一直在持续思考、并重构我们管理 prompt 的方式。在即将发布的 AutoDev 0.8 里,我们进一下完善了现有的上下文构建方式,以模式化的方式重新思考并设计了新的上下文工程体系。而测试生成正是我们的第一个新
- LLM 与架构新纪元:适应代码生成模式,突破软件开发瓶颈
TL;DR 版本:今年 2 月,我们在 QCon 上分享了《组织级架构治理的正确落地方式》,其背后的一个核心思想是:架构即代码。围绕这个核心思想,我们构建了 ArchGuard 的治理功能,即架构规范转换为代码。今年 5 月,我们在 QCon 上分享了《探索软件开发新工序:LLM 赋能研发效能提升》
- 破局之作:首部开源 AIGC 软件工程应用电子书《构筑大语言模型应用:应用开发与架构设计》
TL;DR 版;在线:https://aigc.phodal.com下载 1:https://github.com/phodal/aigc/releases下载 2:https://pan.baidu.com/s/1wGc75vVHaZwvZyHeltyt8w?pwd=phod2023 年的上半年里
- 语言接口:探索大模型优先架构的新一代 API 设计
过去的两三个月里,在开发基于大语言模型的软件时,也一直在思考如何设计一个大模型优先架构。而随着越来越多的团队加入到这场竞赛里,我们会发现:基于大语言模型的软件架构与过去的不同之处,诸如于:我们需要新一代的 API。我暂时将这一代 API 称为:语言接口/语言 API(大概会有大佬来发起新的名称),原
- 规范即治理函数:LLM 赋能的软件架构治理与架构设计
在我们设计架构治理平台 ArchGuard 2.0 的架构时,一直在强调的点是:基于规范 + 模式的工具化。简单来说,规范是架构设计的共时,也是架构知识的显性化。所以,在让 AI 设计架构时,规范是我们要考虑的第一要素,第二要素是:基于现有实现地设计。在 ArchGuard 里,我们遇到的其中一个挑