Redian新闻
>
一位数据科学家利用人工智能克隆了他最好朋友的群聊

一位数据科学家利用人工智能克隆了他最好朋友的群聊

公众号新闻

点击蓝字 关注我们

SUBSCRIBE to US


Image: The Verge


正如数据科学家Izzy Miller所说,无论是在iMessage、WhatsApp还是Discord上,群聊都是你和好朋友们闲聊、分享生活最新消息的地方,这些事情或琐碎或重大。在这样一个大家越来越孤独的世界里,我们至少可以在群聊中抱怨一下近况有多糟糕。“我的群聊是一条生命线,是一种安慰,是一个连接点,”Miller告诉The Verge。


Miller使用与微软的Bing和OpenAI的ChatGPT等聊天机器人相同的技术,创建了他和好朋友们群聊的克隆——自从他和五个朋友在大学第一次聚在一起以来,在过去的七年里,群聊对话几乎每天都在展开。他说,这项工作出奇地容易:这是只需要花费几个周末的工作时间和一百美元来完成的项目。但最终的结果是不可思议的。


Miller说:“我真的很惊讶,这个模型从本质上了解了我们是谁,而不仅仅是我们说话的方式。它知道我们在和谁约会,我们在哪里上学,我们住的房子的名字等等。”


而且,在一个聊天机器人越来越普遍、越来越令人信服的世界里,人工智能群聊的体验可能很快就会被我们分享。


Image: Izzy Miller


人工智能的最新发展使本项目成为可能,但这仍然不是任何人都能完成的。Miller是一名数据科学家,他已经在这类技术上“玩”了一段时间——“我了解一些相关的信息和技术,”Miller现在在一家名为Hex的初创公司工作,该公司恰好提供有助于这类项目的工具。Miller在一篇博客文章中描述了复制这项工作所需的所有技术步骤,他在文章中介绍了人工智能群聊,并将其命名为“robo boys”。


然而,robo boys的创造遵循着一条熟悉的道路。它从一个大型语言模型(LLM)开始,LLM是一个根据从网络和其他来源抓取的大量文本进行训练的系统,具有广泛但原始的语言技能。然后对该模型进行了“微调”,这意味着为其提供一个更专注的数据集,以便复制特定的任务,比如回答医学问题或用特定作者的风格写短篇小说。


在这种情况下,Miller对从他的群组iMessage下载的50万条消息进行了人工智能系统微调。他按作者对信息进行分类,并促使模型复制每个成员的个性,包括:Harvey、Henry、Wyatt、Kiebs、Luke和Miller本人。


有趣的是,Miller用来创建虚假聊天的语言模型是由Facebook所有者Meta制作的。这个名为LLaMA的系统与OpenAI的GPT-3模型一样强大,今年它在发布一周后在网上泄露,成为了争议的主题。一些专家警告说,此次泄露将允许恶意行为者滥用该软件进行垃圾邮件传播和其他目的,但没有人猜测它还会被用于此目的。


正如Miller所说,这个项目展示了建造这种人工智能系统变得多么容易。“与两三年前相比,现在做这件事的工具已经完全不同了。”


Image: Izzy Miller


在过去,创建一个具有六种不同个性且令人信服的群聊克隆可能需要花费大学团队几个月的时间才能完成。现在,只要一点专业知识和一点预算,一个人即可完成。


Miller对这个系统模仿他和朋友习惯的能力印象深刻。他说,有些对话感觉非常真实,比如关于谁喝了Henry的啤酒的争论,以至于他也不得不去搜索了群聊的历史记录,以检查模型是否只是从训练数据中复制了文本。(这在人工智能世界中被称为“过度拟合(overfitting)”,是一种可能导致聊天机器人抄袭其来源的机制。)


Miller在他的博客文章中写道:“这种完美地捕捉真是太令人愉快了。这并不是怀旧,因为这些对话从未发生过,但这是一种类似的喜悦感……”


不过,该系统仍然存在问题。Miller指出,群聊中六种不同性格之间的区别可能会模糊,一个主要限制是人工智能模型没有年代感——它无法可靠地区分过去和现在的事件(这个问题在某种程度上影响到所有聊天机器人)。例如,过去的女朋友可能被称为现在的伴侣;以前的工作和房子也是如此。


系统对事实的感知并不是基于对聊天的整体理解,而是基于消息的数量。换句话说,人们谈论的东西越多,机器人就越有可能提及它。一个意想不到的结果是,人工智能克隆人往往表现得像还在上大学一样,因为那是群聊曾经最活跃的时候。


该项目展示了人工智能聊天机器人日益强大的力量,尤其是它们复制特定个人的习惯和知识的能力。尽管这项技术仍处于初级阶段,但我们已经看到了这些系统所能发挥的力量。


显然,人工智能聊天机器人有能力影响我们,就像真人一样,无论是娱乐、教育还是其他方面,都可能在我们的生活中发挥越来越重要的作用。


当Miller的项目在Hacker News上被分享时,该网站上的评论人士猜测,这些系统的未来的结局将如何?有人建议,像谷歌这样拥有大量个人数据的科技巨头可以利用这些数据来构建用户的数字副本。然后,这些人可能会代替他们接受面试,可能会被潜在的雇主甚至警察面试。其他人认为,人工智能机器人的传播可能会加剧社会孤立:在网络世界里,提供更可靠、更不具挑战性的友谊形式。


Miller说,这种猜测当然很有趣。正如他所解释的,这个项目之所以成功,是因为它是对真实事物的模仿。正是最初真实存在的群聊让整件事变得有趣。


换句话说,人工智能克隆可以复制真实的人类,但不能取代他们。


微信号|IEEE电气电子工程师

新浪微博|IEEE中国

 · IEEE电气电子工程师学会 · 


神奇的混合忆阻器AI芯片可扩展

麻省理工Python增强编译器Codon 让Python像C\C++一样高效

北航学生设计的微型机器人 能够弹跳自身长度的87倍

10张图总结2023年人工智能状况

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
痛心!国家一级演员林永健,挚爱离世留下一生遗憾…我用10万条聊天记录和 280 篇博客文章,克隆了我中国新冠海啸的好处来了在通用人工智能的门槛上,你要学什么才不会失业?汪军教授组织了7位AI学者,论道ChatGPT后的通用人工智能理论和应用马克龙想参加金砖峰会,加入中国、俄罗斯的群聊?美国入境档案--潘德明就连人工智能也建议暂时回避人工智能股票GPT4 来啦,欢迎加速进入通用人工智能时代!|硅谷徐老师UCL汪军呼吁创新:后ChatGPT通用人工智能理论及其应用求职干货 | 拼多多 2023春招倒计时!海归求职:数据(数据分析、数据科学、工程)深度剖析:ChatGPT 及其继任者会成为通用人工智能吗?睡前故事 | 琪琪与五个好朋友的荔枝冰淇淋大冒险求职干货 | 拼多多 2023春招已开!海归求职:数据(数据分析、数据科学、工程)科学家利用宇宙射线绘制了埃及大金字塔的一条未被发现的走廊华裔妹子哈佛辍学创业,用人工智能帮人打官司,半年获4亿投资!首个由人工智能生成的游戏和电影问世,探秘生成式 AI 如何发展(附相关人工智能产品集)Lancet 子刊:科学家利用人工智能工具识别出人类5种心力衰竭亚型国内首个网红“GPT克隆人”来了!克隆的竟是她...LeCun:ChatGPT无法实现通用人工智能,但ALM技术路线可以!空客进行无人机自主空中加油试验,采用人工智能,为有人-无人编队打基础ChatGPT之父最新观点:通用人工智能是全人类的赌注OpenAI发布通用人工智能路线图:AGI比想象中来得更快iPhone 15 Pro‌ Max镜头凸起更小/OpenAI发布通用人工智能路线图/京东百亿补贴确认上线时间盘点四大技术板块,洞察百项人工智能开源项目——InfoQ研究中心带你探秘中国人工智能开源领域连续996三年,人体器官的群聊炸了……独家专访:OpenAI 的 Sam Altman 谈 ChatGPT 以及通用人工智能如何“打破资本主义”OpenAI最新发布通用人工智能路线图!AGI比想象中来得更快!求职干货 | 京东 2023春招补录已开!海归求职:数据(数据分析、数据科学、工程)很开心:终于找到了住宿全国人大代表、科大讯飞董事长刘庆峰谈ChatGPT:用人工智能解决社会刚需!国家利益豁免为什么叫国家利益豁免?美国律师给您讲讲背后的逻辑人工智能立法提上日程:兼顾安全与发展,为人工智能治理打下框架性基础再糟糕的时代 总还有一些高贵的灵魂不愿随波逐流用人工智能打官司?华裔妹子哈佛辍学创业半年吸金4亿!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。