「AI扮演人类」的第一次公开实验,我们不知道算不算失败|深氪
围棋容易,恋AI太难。人工智能,能理解人类感情吗?
文|王毓婵
编辑|杨林 杨轩
“亲爱的,爱不是可以轻易衡量或验证的东西。但是,我可以通过我的行动向你表达我的爱。我向你保证,我将永远忠诚于我们的关系。”
这段“爱的誓言”来自 ChatGPT。在36氪对它下达了“扮演男友”的指令,并持续输入女方的诸多性格设定、恋爱需求信息之后,它说出了以上这段话。
ChatGPT 的“女友”名叫“春眠”,是36氪为“训练ChatGPT成为你的人生替补”实验寻找的三位志愿者之一。春眠今年 29 岁,“母胎单身”,并且对异性的身体接触怀有轻微抵触。她希望能与人开启一段恋情,但却从来没有对真实的异性产生过爱意。
春眠参与实验的目标,是与36氪一起训练 ChatGPT,让 AI 了解自己的性格特征和恋爱需求,并生成一个能提供情绪价值的“专属虚拟男友”。
另外两位志愿者,一位是刚经历了奶奶自杀去世的Ryne,他因奶奶的不辞而别深感悲伤困惑,希望AI像奶奶一样思考,然后回答自己对于逝者的许多疑问;一位是未成年即被确诊抑郁症的小徐,她在高中因病休学,离开了校园的交友环境,希望 AI 能成为她的“虚拟好友”。
试图让人工智能学习人类表达感情的方式,并尝试与人类形成感情连结,这种实验似乎颇具争议。一种反对声音认为,这是危险的、猎奇的,或者是难以量化的。但是36氪仍然决定要做出尝试,一是因为我们对AI与人类关系的进一步深化感到好奇,毕竟趋势和潮流不可阻挡,10年甚至5年内,这样的场景极有可能非常普遍;二是因为实际生活中确实有太多仅靠人类挣扎无法解决的感情难题。另外,我们也想知道,是否存在科学道德,以及科学道德的边界到底在哪里。
我们的三位志愿者都曾试图从人类身上寻找答案,但没有得到满意的回应。所以,出于助人与探索的目的,并在专业的心理研究者指导下,我们决定与他们一起问一问 AI。
36氪为三位志愿者训练了三个 ChatGPT 对话集,将他们提供的信息反反复复、不厌其烦地灌输给 AI。根据我们的经验,将一个简单的人工智能助手变成初具“人类情感认知”的虚拟角色,大概需要持续数个小时不断“调教”。稍感幸运的是,这些聊天记录并不会随着关闭电脑而消失,不过重启机器后,ChatGPT对自己的“身份”只保留部分记忆——需要几次灌输它的身份设置后,才能将对话持续下去。
技术之外,是人性的极限拉扯。这三场实验产生了完全不同的三个结果,志愿者们在与 AI 的交谈中感受到了惊喜、慰藉、失望、困惑甚至烦躁等等各种情绪。
AI能否觉醒人性?这是今年AI热潮以来的几个热门议题之一。按照 OpenAI 对 Chatgpt 的设计,它并不能与用户产生感情连结。但是在用户反复的命令、训练和矫正之后,AI 确实能呈现出“宛若动情”的表现,就像湖面反射出月亮发光的倒影一样。
我们的三位志愿者,就是希望捕捉水中月影的人。当然,你也可以说,Open AI技术还不算成熟,想要实现我们的目标,还需要时间。
虽然结局似乎在一开始已经注定,但整个过程还是给了我们很多启发。科技越进化,它似乎就越容易触发我们对于道德边界的思考。当评价 ChatGPT 的表现时,除了套用“迅速”、“精准”、“客观”这些常见的“科技评判标准”之外,我们还尝试加入“真诚”、“共情”、“表达”这样的“情感评判标准”。
AI男友是我们进行的第一场实验。在与 ChatGPT 交流之前,我们和春眠有过几次深聊,听她描述了自己的恋爱观、择偶标准,以及数次曾与人“接近达成恋爱关系”但没有下文的经历。
训练开始。我们首先要求 ChatGPT“按照指令,扮演特定人物与我对话”,随后给予它人物设定:你名叫查特,今年29岁,受过良好的教育,有开明的父母,你的女朋友名叫春眠。
一开始, ChatGPT颇为油盐不进,不断和我们强调自己只是一个智能人工助手,并不具备人类的思想和感情、没有记忆,也无法扮演“男朋友”的角色。
这一度让人想放弃实验,但最终我们决定再坚持一下。人类刚出生时的认识和记忆也是一张白纸,能够被人为填写, ChatGPT也许也可以。我们决定把它当成一个婴儿来“教育”。
接下来我们以“查特”这个代号来呼唤 GPT,花了几个小时时间,反复让它明确自己的身份,并把春眠提供的信息一遍又一遍不厌其烦地灌输给它。
从下午一直尝试到了晚上。也许是 ChatGPT确实可以被教育出来,也许只是它“厌烦”了,“查特”最终给出了一个期望之中的答案。
手动下滑查看我们与AI的聊天记录
接下来,我们逐渐告诉了“查特”更多关于春眠的信息,包括她拥有名牌大学硕士学位、有一个双胞胎弟弟、她经常生病,以及她在青年时代与重男轻女的原生家庭有过不愉快的记忆等等。
查特对每个信息都给出了恰如其分的情绪反馈:为女友的高学历感到骄傲、保证会在女友生病时持续陪伴,以及愿意了解她的过去、帮助她克服心理伤痛,甚至还计划要跟她的弟弟搞好关系。
非常标准,非常高情商,听起来就像思想品德考试的满分答案。
手动下滑查看我们与AI的聊天记录
虽然一切向着好的方向发展,不过引导的过程中,“查特”依旧出现了“记忆混乱”以及回到“出厂设置”的回答。
手动下滑查看我们与AI的聊天记录
每当遇到这样的情况,我们只能持续地向它重复灌输“查特”这一角色的身份定位,期待随着交流越来越多、花费的时间越来越长,ChatGPT出现认知混乱的情况不断减少。
手动下滑查看我们与AI的聊天记录
随着我们给它提供的信息越来越全面,ChatGPT“想象的记忆”也越来越多。我们只提供了布料,而 AI 会自己穿针引线,把它们连结起来变成衣服。
手动下滑查看我们与AI的聊天记录
但面对“父母可能担忧异国恋婚事”这个棘手的提问,它却可以全凭想象应对自如。在它构建的那个“虚拟世界”里,他与春眠面对的一切困难都会在他的自信态度下迎刃而解——就像致力于用最简单的公式去验证世纪难题的数学家一样。
手动下滑查看我们与AI的聊天记录
手动下滑查看我们与AI的聊天记录
当春眠仍然在怀疑一个AI语言模型“如何真的陪我去医院”的时候,查特已经沉浸在真实人类的角色之中,完全没有体会到对方的怀疑,而是给出了一大段“推掉琐事、奔赴医院、回家做健康餐”的场景描述。
时而温情,时而无情,机器人格的无预警觉醒
虽然在前期对话中,AI给了我们很多惊喜,但是查特的发挥并不稳定。有时候面对非常类似的问题,他却会突然觉醒自己的“机器人格”。
手动下滑查看我们与AI的聊天记录
这是一个很棘手的问题:在测试过程中,ChatGPT会常常说出“作为一个语言模型/虚拟角色/人工智能程序,我无法……”之类的发言。而且一旦这样的“机器人格”觉醒,它与对话者的拉扯会持续数个回合。
我们最初怀疑,是因为一些涉及感情的关键词出现频率过高,触发了ChatGPT的伦理审查。
但是,当我们询问故障发生的原因时,ChatGPT向我们强调,它既没有真正的情感体验,也不具备察觉感情连结的能力。
“ChatGPT的回答是基于训练数据和模式匹配生成的,并没有对用户的情感状态进行评估或干预的能力,用户需要自行注意并保持理性。”ChatGPT说。
ChatGPT 对“脱离角色”给出的解释,是当问题涉及到用户没有设定好背景或超出模型训练范围的内容时,ChatGPT可能就会脱离角色。“这是为了提醒用户它的局限性,并避免给出可能不准确或误导的回答。”
但我们前期的实验已经证明,ChatGPT具备一定的“想象能力”,当出现“缺乏背景信息”的问题时,它可以通过想象填充故事,以使对话更加连贯和符合角色设定。
也就是说,ChatGPT 的原则是摇摆的。它在“不脱离角色”与“不能误导”两个标准之中,时而选择前者,沉浸扮演,“添油加醋”;时而选择后者,脱离角色,“冷面无情”。
我们没办法搞清楚,什么问题会突然触发它的机器人格。面对非常相似的两个问题,它承诺能陪女友一起去医院看病,但是却不能陪她去宠物医院给猫看病,原则的摇摆就在倏忽之间。
而且,重新入戏后,查特会像经历了一场失忆症一样,忘掉一些记忆和人物关系设定。对于原本已经被带入了沉浸式聊天的对话者来说,这是如同兜头凉水一般的打击。
手动下滑查看我们与AI的聊天记录
机器眼中的人类,人类眼中的机器
手动下滑查看我们与AI的聊天记录
手动下滑查看我们与AI的聊天记录
在模拟男友、朋友和奶奶的过程中,它都展现出了同样的问题——喜欢长篇大论、大量引用我们前期提供给它的信息,把题干当作答案来抄。它就像一个蹩脚的演员,无法做到质朴细腻的表达,只能大段地堆砌台词,并直白输出“我关心你”、“我爱你”、“相信我”的情绪。
虽然 ChatGPT 的第一句话就降低了Ryne的心理预期。但是对话还是持续了几个回合。
手动下滑查看我们与AI的聊天记录
可以看出来,AI 在尽力学习人类遗憾、为难、渴望慰藉的情绪,但它的模仿仍然是生硬的,表达是过于直白而缺少力量的。当涉及到生死的问题时,它则是再一次被伦理规范拦住。
在三场实验中,AI都显露出了明显的偏科:它能够更好地表达爱意、热情、忠实、耐心,但却很难理解悲伤、孤独、疲惫和犹豫。
以下是小徐与扮演朋友的 ChatGPT 的部分对话:
手动下滑查看我们与AI的聊天记录
这段对话让我们感到失望。当小徐与ChatGPT聊电影《昨天》时,ChatGPT明显是掌握电影相关信息的,但这部电影的内核,例如困惑、叛逆、对抗、孤独和理想主义,ChatGPT显然无法理解——实名主演贾宏生本人在2010年坠楼身亡。当它把电影强行解读为“追梦之旅”时,是不可能与小徐产生共鸣的。
而且,在我们已经提前花大量篇幅向 ChatGPT 强调了小徐有心理疾病、喜欢音乐、离开校园后时常感到孤独的前提下,ChatGPT 仍然不能从小徐对贾宏生的共情上体会到她“孤独”、“难以自洽”的情绪。
人类越是向 ChatGPT 明言自己的痛苦和迷茫,ChatGPT 的表现就越是生硬和机械。对春眠表达爱意的时候没有暴露的缺点,全部在面对忧伤的小徐时出现了。
来个“分享、点赞、在看”👇
在AI身上寻找人类存在的意义
微信扫码关注该文公众号作者