Redian新闻
>
代码生成:基于 AI 大模型的挑战与前景

代码生成:基于 AI 大模型的挑战与前景

科技

作者 | Ben Linders
译者 | 马可薇
策划 | 丁晓昀

使用 AI 通用模型来完成代码生成这类非常具体的任务可能会带来问题。人工智能生成的代码就像是陌生人的代码,它们可能并不符合你的代码质量标准。这种情况下,创建专业或专用的模型不失为一条出路。

Luise Freese 和 Iona Varga 在 2023 年的 NDC Oslo 大会上探讨了 AI 模型的实践困境和伦理相关问题。

Varga 提到,“人工智能”这个词给人一种智慧的感觉,虽然这个名字实际只是代表了这些模型的构建方式。以节点相连的形式模仿人脑中神经元与突触连接而成的网络,这类模型因此而得名“人工网络”或“人工智能”。

Freese 补充道,抽象来说,计算机是完全依赖于或开或关的晶体管,通过这些开关的组合,我们得以操纵比特。由于晶体管之间没有相互的纠缠,这些开关最终会带来这样的结果:

因此,计算机并不会思考,不过是我们的人工智能算法赋予了它们个性和特征,比如“让我考虑一下”这类礼貌说辞。AI 仅仅是利用统计数据对事物进行预测、分类或组合。

Varga 提到,AI 的问题在与使用极其通用的模型或是基础模型完成非常具体的任务。大语言模型(LLM)的工作原理是先分析问题、创建一两个词语,再根据统计数据预测下一个标记的最佳匹配。此外,LLM 本身是无法对事实进行核查的,因为这类模型的设计目的是生成而非验证。

如果我们试图建立一个能解决所有 AI 问题的 AI 模型,那么我们将会创造出一种自我放大的螺旋式下降,Freese 补充道。若想实现螺旋式上升,那就应该少用基础模型,多用更为具体的模型,后者中有一部分实际就是搭建在基础模型之上的。

AI 或许能生成代码,但这些代码是否能安全地使用,是否能满足我们对质量的标准要求?Varga 认为这些问题只能由真正的人类来回答,这一过程并不容小觑。归根结底,就像是代码的编写一样,调试陌生人的代码远比自己从头到尾参与其中的代码更为困难。

一般模型的理解能力也更为通用,这在代码生成问题上可能会带来问题,正如 Varga 所解释的:

举例来说,React v17 或 v16 这些可能没有直接反应在模型的上下文中,但模型也能了解这些代码库。或许你会发现自己生成的一个函数中会混杂有两个版本的代码。

Varga 认为,多数情况下 AI 都是解决问题的好帮手。但使用 AI 就意味着你要去检查、验证、修改、编辑或重写部分内容,而这一部分可能才是我们低估 AI 工具带来工作量的地方。

InfoQ 针对人工智能所带来的挑战问题采访了 Luise FreeseIona Varga

InfoQ:什么因素会造成 AI 的失败?

Iona Varga: 一般来说,AI 并不是命中注定要失败的。我是医学物理出身的,我也见过很多优秀的 AI 工具,它们能出色地完成波弹性成像的实时剪切,早期阶段的婴儿检测,甚至能检测出肿瘤专家都无法发现的肺癌细小结节。

但由于虚假数据和扭曲事实问题的存在,这些结果并不完全可信。举例来说,川普就职典礼上,实际的到场人数是要少于最初公布的数据。试着问模型就职典礼的公园有多热闹,你大概会得到一个出乎意料的答案。但同样,数据的来源时至今日也有颇具争议的历史背景,它们可能会出于政治剧本或标准等原因而被修改。

InfoQ:伦理道德如何才能帮助我们解决 AI 所带来的问题?

Luise Freese:伦理道德作为工具本身是帮不上太多忙的。伦理只是一种工作的方式,就像是 DevOps 一样。一旦你有了规划,知道该做什么了,“伦理道德”就是你对“完成”的定义。我所用的数据是否覆盖了所有产品使用相关的人或事?通过这些道德的检测,我们的工作方式将会在可访问性、包容性和避免偏见方面得到改善。

原文链接:

The Challenges of Producing Quality Code When Using AI-Based Generalistic Models(https://www.infoq.com/news/2023/10/producing-quality-code-AI/)

声明:本文为 InfoQ 翻译,未经许可禁止转载。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐
京东辟谣“刘姓商人涉嫌违法被抓”;比特大陆全员工资暂停发放;一周可居家办公3 天,去哪儿灵活办公制度出炉|Q资讯
主力开发已经 68 岁了!“老龄化”严重的 Postgres 开源社区呼唤“年轻一代”
无服务计算,厂商究竟在打什么算盘
放弃 React 改用 Web 组件,微软这次重构让开发者不解:没有任何意义

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
准外公准外婆为啥挨了一针?科研上新 | 第2期:可驱动3D肖像生成;阅读文本密集图像的大模型;文本控制音色;基于大模型的推荐智能体从光刻机到纳米压印,半导体行业拐角处的挑战与机遇画你所想!北航港大提出DiffSketcher:基于扩散模型的文本驱动矢量化手绘草图合成AI Agents先行者CAMEL:第一个基于大模型的多智能体框架中科大提出:LLMs的个性化综述,详述大模型与个性化的挑战与机遇花辞树免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!海外名校1v1科研:基于加性模型的竞技体育世界纪录进化过程的探究|收获一作论文与导师推荐信!NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的多智能体框架直播预告|空间计算的挑战与想象AI的大模型时代 ≠ 只有大模型的AI时代从光刻机到纳米压印,半导体行业拐角处的挑战与机遇 | 峰瑞创投对话苹果进入中国30周年 / Meta 将推出自动代码生成软件 / 视觉中国索赔事件进展 | 灵感周报爱美丽生日快乐2023中国纪行(2) 台风杜苏芮下的海河两岸渔歌子(2):青翠丛林空气新科研上新 | 大模型推进科研边界;大模型的道德价值对齐;优化动态稀疏深度学习模型;十亿规模向量搜索的高效更新开源打败闭源?Meta 即将推出开源代码生成平台 Code Llama,剑指 OpenAI Codex不用4个H100!340亿参数Code Llama在Mac可跑,每秒20个token,代码生成最拿手|Karpathy转赞ICCV 2023 | 基于预训练视觉语言模型和大语言模型的零样本图像到文本生成微软发布基于LLM的代码生成神器,动动嘴就能写代码!NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSSNeurIPS 2023 | MSRA、清华、复旦等联合提出AR-Diffusion:基于自回归扩散的文本生成“离职乌龙”之外 长安汽车董事长面前的挑战与机遇ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力大模型需要什么样的智算中心?7位大咖谈AIGC时代算力挑战与风口丨GACS 2023开源打败闭源?Meta即将推出开源代码生成平台Code Llama,剑指OpenAI Codex当 Apache Doris 遇上大模型:探秘腾讯音乐如何基于大模型 + OLAP 构建智能数据服务平台面对留学的挑战与机遇,曼大硕士说:这6点是关键......Nature:基于人工智能的开源软件,正在标准化显微镜生成数据的图像格式AI时代未来国际化人才培养的挑战与创新:多邻国英语测试第二届校长论坛在深圳举办NeurIPS 2023 | SlotDiffusion: 基于Slot-Attention和扩散模型的全新生成模型李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型1v1-SSCI期刊论文发表指导:基于ARDL模型的经济结构与碳排放问题研究
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。