Redian新闻
>
OpenAI:搞 Agent 时,你要注意这些

OpenAI:搞 Agent 时,你要注意这些

公众号新闻

这两天参加了 OpenAI 的一些活动。有一部分是讨论 Agent/智能体系统在落地时,遇到的各种问题,以及一些可行的实践。这里我带来了一些笔记。

基于下面的这篇论文

地址是:https://openai.com/research/practices-for-governing-agentic-ai-systems


———— / BEGIN / ———

01

关于 Agent

Agent 是一种 AI 的应用方式,但随着语境的迁移,它慢慢从「AI 应用」里剥离了出来。不准确来说,这里的感觉,就像是 H5 从 html5 中剥离了出来。

按当前的语境,我们会把 ChatGPT 就是看成一种 AI 应用,它能理解你的问题并给出回答。而会把 GPTs 这种订制后的、能调用外部功能的、能够自己处理复杂任务的产品,叫做 Agent。

Agent 和 AI应用(如ChatGPT)之间的区别和联系主要体现在“代理性”(agenticness)这的程度上。如果一个AI系统,能够在没有直接人类监督的情况下运作,其自主性越高,我们称之为代理性越强。这是一个连续体,不是非黑即白的判断,而是根据它在特定环境中的表现来评估其代理性的程度。

在这种定义下,正统 Agent 不仅能回答问题,还能自己决定做什么,它能够通过生成文本来“思考”,然后做出一些操作,甚至能创造出更多的 AI 帮手来帮帮忙,就比如下面这个图。

但我们发现,尽管 Agent 看起来很美好,但在实际落地的场景中,也是困难重重,风险多多,出现了问题,责任划分也很麻烦。比如这里:如果我希望让某个 Agent 帮我微信收款,但它给别人展示的是付款码,那么这里谁背锅?

也是因为这些问题,就有了本次的话题:「从实践的角度出发,落地 Agent 有哪些注意点」。共包含 7 个主要点:执行效果评估、危险行为界定、默认行为确定、推理透明展示、Agent 行为监控、Agent 作恶追责、危险事故叫停。

02

Agent 落地难点

由于会上的 PPT 不便分享,我便在自己吸收后,重新制作了一份 PPT,安心食用

1. 执行效果评估

在商业环境中,确保任何工具的可靠性是基本要求。

然而,AI Agent 的复杂性在于其工作场景和任务的不确定性。例如,一个在模拟环境中表现优异的自动驾驶车辆,可能因现实世界中不可预测的变量(如天气变化和道路条件)而表现不稳定。

我们尚缺乏有效的方法,来准确评估 AI Agent 在实际环境中的性能。

2. 危险行为界定

AI Agent 在执行高风险操作之前需要获得用户的明确批准。例如,在金融领域,AI 执行大额转账前必须得到用户同意。

但需要注意,频繁的审批请求可能导致用户出现审批疲劳,从而可能无视风险盲目批准操作,这既削弱了批准机制的效果,也可能增加操作风险。

3. 默认行为确定

当 AI Agent 遇到执行错误或不确定的情形时,是要有一个默认行为的。例如,如果一个客服机器人在不确定用户需求时,其默认行为是请求更多信息以避免错误操作。

然而,频繁的请求可能会影响用户体验,因此在保障系统安全性与保持用户体验之间需要找到平衡。

4. 推理透明展示

为了保证 AI Agent 决策的透明性,系统需要向用户清晰展示其推理过程。举例来说,一个健康咨询机器人应详细解释其提出特定医疗建议的逻辑。

但如果推理过程太复杂,普通用户可能难以理解,这就需要在确保透明性和易理解性之间找到平衡。

5. Agent 行为监控

假设一个 AI 系统用于监控仓库库存,如果监控系统误报,误认为某项商品缺货,进而不断的进货,那么可能导致库存的严重积压,并造成极大损失。

于是,我们思考:是否需要另一个 Agent 来监控这个 Agent?成本账怎么算?

6. Agent 作恶追责

考虑一个匿名发布内容的 AI Agent,如果其发布了违规内容,要追踪到具体负责的人或机构可能极其困难。这种情况下,建立一个能够确保责任可追溯的系统尤为关键,同时还需要平衡隐私保护和责任追究的需求。

7. 严重事故叫停

想象一个用于自动化工厂管理的 AI Agent,在系统检测到严重故障需要立即停机时,不仅需要停止主控系统,还要同步关闭所有从属设备和流程。如何设计一个能够迅速且全面响应的紧急停止机制,以防止故障扩散或造成更大损失,是一项技术和策略上的复杂挑战。

最后,本次就这些。

———— / E N D / ———

作者:赛博禅心

来源微信公众号:赛博禅心

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
怎样和listing agent 讨论价格?CellAgent:LLM Agent 助力单细胞测序数据分析的重要突破丨AI 4 Science报税最后一天!截止前你还需要注意这些旅行的尽头是日本(29)结语3、长篇家庭伦理小说《嫁接 下》第一章 情敌过招(3)美股基本面 - 2024_03_05 * 晨报 * 花旗策略师称美国科技股看涨头寸处于三年高位 警告股市回撤风险。比特币市值已OpenAI 宣布终止对中国、朝鲜、俄罗斯等地区提供 API 服务,大家怎么看?People Mountain, People Sea: Labor Day Holiday in Photos外企社招丨Dräger德尔格,行业全球领导者,15薪,六险一金,多样福利,偏爱留学生澳洲报税季马上到!华人们注意,千万要注意这些!「代理人战争」!微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱OpenAI releases real最新资讯!澳洲人每年工资少发8.5亿;复活节长周末一定要注意这件事;政府拨款3100万澳元,免费为婴幼儿接种疫苗!留学生退租遭房东“提灯定损”,各种理由被扣1000多刀!澳洲租房搬家一定要注意这件事国外研究:吃饭的时候注意这16点,你可以活得更长!天天都在说AI agent,这些制造AI agent的人们究竟在想些什么海外资产申报竟有这么多误区!新移民第一次报税前后要注意这些事!卖房选3%的local agent, 还是1.5%的redfin agent?海边纳凉注意!麻州近30个海滩细菌超标 游泳要注意这些2023回国散记(38)出生地:茶山、温泉、农家乐浓人,nèng死淡人#英语学习#英语俗语:Get Roped IntoAnthropic找到了打败OpenAI的方法:自己也成为OpenAI赞爆!多伦多华人回国又多一个选择!中国推出新航线, 近期入境要注意这个检测!七人落网、三百人被调查!曼岛移民暗流涌动,申请曼岛项目一定要注意这些......出门住酒店要注意这4点,美医生曝光"这两样物品"容易交叉感染雷军:找联合创始人,要注意这几个问题挺突然呀,OpenAI CEO奥特曼和他的丈夫承诺捐出大部分财富这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单华人回国又多一个选择!中国推出新航线, 近期入境要注意这个检测!美国留学生注意,F1签证申请新规,这些重大变化要注意!G 端客户调研指南:搞懂四个问题,轻松上手!如何写好摘要和关键词?生物医学科学研究,特别需要注意这些!The New Talent Show Striking Fear Into China’s Biggest Pop Stars猫与狗准留学生注意!2024年F1签证申请新规出炉,这些重大变化要注意!真假 Agent 大讨论:我的 Agent 可能是个 Chatbot,但它真不行吗?| 直播预告画面曝光!悉尼城铁站近2000次事故报告,900名乘客受伤!冬季阴雨天气来袭,乘客受伤事故激增!悉尼人一定要注意这件事...离世界模型更近一步!Meta开源OpenEQA,评估AI Agent情景理解能力2024年「F1签证申请新规」汇总,准新生要注意这些重大变化!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。