Redian新闻
>
GitHub 基于大语言模型构建 Copilot 的经验和教训

GitHub 基于大语言模型构建 Copilot 的经验和教训

科技

作者 | Matt Saunders
译者 | 明知山
策划 | 丁晓昀

GitHub 在一篇文章中分享了他们在构建和扩展 GitHub Copilot——一个使用大语言模型的企业应用——过程中所学到的经验教训。

在 GitHub 的一篇博文中,GitHub 的 AI 产品负责人 Shuyin Zhao 描述了他们如何在三年多的时间里历经三个阶段——“Find it”、“Nail it”和“Scale it”——成功推出了 GitHub Copilot。

在“Find it”阶段,他们专注于找到 AI 可以有效解决的问题,通过一种足够专注的方式快速推向市场,并且足以产生影响。

这包括确定到底是为了谁而解决问题——帮助开发人员更快地编写代码,减少上下文切换。此外,他们只关注 SDLC 的一部分:IDE 中的编码功能,并结合当下的 LLM 的能力。这样他们就可以专注于让工具提供代码建议,而不是生成全部代码。他们还致力于确保他们所做的是对现有工具进行增强,不要求开发人员改变已有的工作流程。


“在设计产品时,我们不仅要考虑输出需要人类进行评估的模型,也要考虑正在学习如何与 AI 互动的人类。”


——Idan Gazit,GitHub Next 高级研发总监

在“Nail it”阶段,他们基于从 A/B 测试中获得的真实用户反馈进行迭代式产品开发。他们进行快速迭代、试错和学习。在使用 Copilot 的 Web 接口进行了简短的实验后,他们将重点转向了 IDE,以减少在编辑器和 Web 浏览器之间切换,并让 AI 在后台运行。在进一步的迭代中,通过观察开发人员在编码时打开的多个 IDE 选项卡,GitHub Copilot 可以同时处理多个文件。

随着生成式 AI 的迅速发展,他们开始重新审视过去所做出的决策,技术的进步和用户对它的熟悉程度有时会让过去的决策变得过时。于是,提供交互式聊天的想法开始活跃起来,他们需要基于沉没成本谬论改变决策,例如,当大语言模型的进步允许一个模型处理多种语言时,就需要改变为每种语言构建 AI 模型的想法。

最后,在“Scale it”阶段,他们致力于确保 AI 模型结果的一致性、管理用户反馈,并定义了关键性能指标,以实现应用程序的普遍可用性 (GA)。他们还考虑了安全性和 AI 责任问题,使用过滤器来避免为用户建议不安全或具有冒犯性的代码。

改进质量和可靠性方面的工作包括缓解大语言模型的幻觉,即答案可能是不可预测的,并且每次查询都有所不同。解决这个问题的策略包括修改发送给大语言模型的参数,以减少响应的随机性,并缓存频繁的响应以减少变化和提高性能。

GitHub 使用等待列表来管理技术预览版的早期用户。这意味着他们可以获得来自一小群早期采用者的评论和反馈。对真实用户反馈的深入分析使得 GitHub 团队能够识别出有问题的更新,并改进产品的关键性能指标,例如开发人员保留了多少由 Copilot 生成的代码。

最后,他们确保开发人员生成的代码是安全的,并通过过滤器来拒绝可能引入安全问题 (如 SQL 注入) 的代码建议。社区也提出了一些问题,例如 Copilot 的代码建议与公开的代码相重叠可能会产生许可问题或其他影响。他们为此提供了一个代码参考工具,帮助开发人员做出明智的选择。

在市场策略方面,他们向一些有影响力的社区成员展示了技术预览版,并且面向的是个人用户而不是企业。这有助于在正式发布时获得广泛的支持,从而促使企业采用它。

关键在于展示专注于特定问题的重要性、整合实验结果和用户反馈,以及在应用扩展时优先考虑用户需求。

由于生成式 AI 的采用仍处于早起阶段,GitHub 也在密切关注市场对生成式 AI 工具的需求。感兴趣的读者可在 GitHub 的博客上阅读全文。

原文链接

https://www.infoq.com/news/2023/10/github-copilot-lessons/

声明:本文为 InfoQ 翻译,未经许可禁止转载。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐
下一代 Docker 来了!1小时构建缩至1.5分钟,还能结合 LangChain、Ollama 等做 AI 应用开发
苹果中国App Store将不允许未备案应用上架;iPhone 15发热严重,问题源于第三方软件?Meta又要裁员了 | Q资讯
微软裁员内幕
Angular 重磅回归

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
重塑 GitHub、颠覆程序开发:GitHub Universe 2023 发布重大更新炸了!!!亚马逊40亿美元投资大语言模型公司Anthropic。。。小说:兰欣与乌茶资管基础|三周掌握摩根大通“模拟交易&风险管理” 及“资产配置模型构建“双项目,一站式直通华尔街!花椒树(Zanthoxylum)Github Copilot Chat 公测:已可在 Visual Studio 和 VS Code 中使用吴敬琏:日本的经验和教训,对中国有很大的借鉴意义大语言模型真能“理解”语言吗?文档字越多,模型越兴奋!KOSMOS-2.5:阅读「文本密集图像」的多模态大语言模型要生活,而不仅仅是生存:温哥华盛夏天堂小岛的探险与野餐陈丹琦 ACL'23 Tutorial - 基于检索的大语言模型 学习笔记MIT惊人证明:大语言模型就是「世界模型」?吴恩达观点再被证实,LLM竟能理解空间和时间在公立小学怎么学好英语?弯弯绕绕5年后,我的经验和教训搞大模型巨亏,微软都还没挣到钱!GitHub Copilot每月收10刀,倒赔20MIT惊人再证大语言模型是世界模型!LLM能分清真理和谎言,还能被人类洗脑日本日记9: 富士宫市邂逅富士山ICCV 2023 | 基于预训练视觉语言模型和大语言模型的零样本图像到文本生成MetaMath:新数学推理数据集揭秘,让大语言模型突破逆转诅咒ACL23 | 基于检索的大语言模型-陈丹琦报告阅读引领创新!新药开发中器官芯片模型构建与应用论坛进城: 去旧金山视觉模型+大语言模型:首个支持10K+帧长视频理解任务的新型框架比 GitHub Copilot 更强大?Meta 开源 AI 编码工具,能跨多语言补全和调试代码如何不被反复收割?我的6次熊市经验和教训比 Spark 快 9 倍,超越 ClickHouse,在大语言模型时代构建全新数据平台重塑GitHub、颠覆程序开发:GitHub Universe 2023发布重大更新哈工大发布大模型思维链推理综述:200+文献全面解析大语言模型思维链推理最新进展这几年陆续买了1000多万私募,也从得失里总结了这些经验和教训Hugging Face 大语言模型优化技术Github发布Octoverse开源报告!印度将超美国成最大开发者社区,生成式AI增长248%,Copilot重构GitHub苹果正利用大语言模型改造 Siri / Copilot 或将引入 Win 10 系统 / 南航称系统bug所售低价票有效大语言模型击败扩散模型!视频图像生成双SOTA,谷歌CMU最新研究,一作北大校友当 Apache Doris 遇上大模型:探秘腾讯音乐如何基于大模型 + OLAP 构建智能数据服务平台OpenAI科学家Andrej Karpathy力荐,23年必读的大语言模型论文清单黑翼资产-邹倚天:从信号挖掘到模型构建,全流程AI拓宽量化边界
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。