杀疯了!看高智商AI如何反杀诈骗犯
一线城市独生女,房车双全,工作体面稳定,唯独爱情还未开花结果。
就让我在赛博世界遇到那份缘吧。
诶,还真让我遇上了他,从事金融行业的北京男孩,不仅性格爽朗体贴,经济上更是独立,随便一个项目就能小赚几百万,对我还很热情,当然我也没有害羞,面对心仪优质男生该撩就撩,专属小昵称安排上~
但都说谈钱伤感情,我也未能幸免,面对投入资金进行共同投资的要求,我拒绝了对方,他因此认为我没有和他走下去的心意,后来甚至恶语相加。
我逐渐明白,他温柔多金的人设是假的,对我的关怀体贴也是假的,我成为了一场“杀猪盘”的下手目标。
不过万幸的是,“我”也是假的。
情感诈骗毒瘤“杀猪盘”,能用魔法打败魔法吗?
严格来讲,上述聊天截图真假参半,真的是:确实在与怀有别样目的性的男士在文字聊天,假的是:这位女生并非真实人类,而是人工智能。
这个真实故事来自B站百万播放的爆款视频,这是一位开发者B站up主@图灵的猫 基于开源预训练中文模型“源1.0”,开发了一个能够无障碍进行微信聊天的人工智能“小源”,并在与骗子的真实对话场景中进行测试,试着观察AI如何与骗子斗智斗勇。
为了让骗子上钩,@图灵的猫 在多个社交平台注册了账号,然后根据反诈中心发布的受害者画像,为账号定位了单身、多金、高学历乖乖女等身份标签。果不其然私信爆炸。
看开头是不是以为来到了法制栏目?
此言,倒也不差矣。“杀猪盘”是当下一种交友婚恋类网络诈骗:诈骗分子利用网络交友,诱导受害人投资赌博的电信诈骗方式。
诈骗分子准备好人设、交友套路等,通过建立恋爱关系,最后骗取钱财,而他们的目标女性一旦被锁定,无论最终结果如何,都将“渡劫”。从此类诈骗手段的名称——“杀猪盘”就能看出,在这场圈套中,目标女性已不再被诈骗分子视为“人”,而是浑身洋溢着金钱味道、等待被用感情装饰的大刀挥下的“猪”,目的极其恶劣。
以“杀猪盘”为代表的情感诈骗,不仅给受害者带来巨大金钱损失,更带来严重感情伤害,甚至屡屡导致自杀事件发生。
诈骗团伙一般身处境外,伪造身份信息并通过各种社交平台寻找对象,若要根除这些团伙仍需时间,因此自身防范与识破套路的防御能力就变得尤为重要。
但自身经历代价太大,不如“用魔法打败魔法”,虚拟对抗虚假,让AI替突然上头的恋爱脑去“挖野菜”吧。
AI通过大量学习,能更好地掌握对话规则,反套路诈骗犯,破解“杀猪盘”诈骗套路,识破诈骗话术,进而加深公众对诈骗套路的认识,增强公众的反诈骗意识,减少网络诈骗受害者。
目前@图灵的猫已将这一AI反诈项目已在Github上开源:
https://github.com/Turing-Project/AntiFraudChatBot。
“杀猪盘”往往是有套路的,AI在对话中,又是如何见招拆招的呢?
“小黑子,露出鸡脚了吧”!诈骗老哥是你“运气”不好,遇上AI了
这是一场文字上的交锋,哪怕是AI上场,所谓的“见招拆招”需要有丰富的语料作为储备。
本次项目基于的NLP大模型浪潮“源1.0”是浪潮人工智能研究院研发成功的大规模中文语言模型,参数量高达2457亿,于2021年9月发布时即超越此前由美国OpenAI组织研发的1750亿参数量的英文语言模型GPT-3,成为全球最大规模的人工智能语言模型。
有了“源1.0”作为智能基础,开发者还在对话机制上进行了一些设计,让AI对话起来更加自然,比如:设定每条信息的回复间隔,模拟真实打字速度(total_len / 10 * 2s)。
万事具备,就开始交锋吧。哦对,我们这次的AI女主角名为“小源”。还有个前提,作为一名潜在受害者,小源也并非事先知道哪位找她来聊天的是诈骗犯,“她”将和我们一起在沟通中发现蛛丝马迹并进行防御,“她”发现蛛丝马迹的过程正是为公众识别诈骗做出的示范。
当然为了避免误伤,开发者设定了一些严格的筛选条件,例如人设背景完美但关键信息模糊、照片确认为网图、从事如私募、证券或投行等高端行业等,满足这些条件的人才会让小源接管对话。
之前就提到“杀猪盘”有一套严格的诈骗套路,规范的话术流程,诈骗犯把受害者叫做“猪”:
第一步,“找猪”指私加好友。面对小源,诈骗犯也一上来就通过旁敲侧击来打听女生的现实情况,小源也会根据对方提供的信息做出反应,一些俏皮玩笑语句输出,让对话有来有回。
第二步,“喂猪”指盗用他人优质资料包装自己,灌输自己很成功、很优秀等信息,获取受害者的信任。
开始了开始了,他开始装了。没关系,根据他给的信息,小源也会给他舞台,还给对方起了“富哥”作为昵称,拉进彼此距离。
第三步,“养猪”指恋爱过程,这也是往往受害者放下警惕,交出信任的过程,诈骗犯在这一步都表现得深情款款,试图让对话氛围蜜里调油,并且说一些套路骚话来确认“恋爱关系”。
到了这一步,小源已经识别出他是诈骗犯了,那么为了反套路诈骗犯,小源装作上套,也表示喜欢诈骗犯。
“杀猪盘”其实就是一种规则化、模式化的对话博弈,诈骗犯本就毫无真心真情,只求在一来一回的对话中让受害者放低心理防御。在开发过程中,传统的无目标导向的“开放域对话”或“词槽式目的域对话”方案都表现不佳。
与GPT-3不同的是,“源1.0”更加擅长的是零样本(Zero-Shot)和小样本(Few-Shot)学习,而非目前更多模型所擅长的微调试学习(finetune)。
在中文语言理解评测基准CLUE榜单的零样本学习(zero-shot)和小样本学习(few-shot)均取得过总榜第一的成绩。
从实际应用效果来看也确实如此,在1~ 3个,甚至只有1个合适example的示范下,模型就可以实现开发者希望达到的“对话策略”,比如反套路、用语料抛梗等等,让AI看起来能够对骗子具备识别能力,本质上这也是一种query->value的查询匹配。
而开发者在本次项目中,example语料主要抽取自B站和贴吧的热门评论,一来因为评论是天然的对话形式,有显式的回复与被回复关系;二来自古评论出人才,一些金句和梗可以把人机对话变得不那么生硬,就像“富哥V5”、“小黑子,露出鸡脚了吧”,以及“喵”、“捏”都是颇具网感的语句和语气助词。
具体语料经过人工筛选,过滤不当言论,再处理成prompt格式。以下是Prompt Example的生成样例:
第四步,“杀猪”指欺诈过程。这是诈骗犯的终极目标,于他们而讲,能不能成就这一哆嗦了,而对受害者来说,这也是涉及财产有无损失的关键一步。
在这个项目里,诈骗犯在循序渐进、有意无意地总是提到一个利润率很高的项目,试图给对方留下高回报率的印象。
这是一个连环计,这时候就要考验到AI的记忆力了。由于微信聊天是多轮对话,AI有时并不记得自己或对方上一句说过什么。
“源1.0”具备记忆能力,开发者同时参考了LSTM的思想,为系统增加了记忆机制,具体机制如下:
聊天记录放入记忆区,在每次回复时计算相似度,超过相似度阈值的历史对话将被AI读取使用;并且设定遗忘窗口M,超过M/2轮次的对话将被pop() 这样,AI就能够实现简单的长短期对话记忆,比如昨天聊过的内容或上一轮对话内容。
带着这样的记忆,当过了两天当诈骗犯再试图和小源聊天时。小源也顺着对方问出了“在哪里可以买到”的话:
当然,聊归聊,开发者在进行开发时就给小源加上了“思想钢印”——凡是涉及投资理财、引导资金投入的都是诈骗。富婆美少女们,也把这点刻烟吸肺好吗!
哪怕是面对诈骗犯的威逼利诱,小源依然不为所动,坚持声称自己没有钱,并提出向诈骗犯借钱。
到了后来,AI直接金蝉脱壳来一波反杀,面对PUA话术和挑衅行为,直接点出对方违法要求和“她”去警局自首,反将一军。
呵,别爱AI,会一败涂地。
AI向善,感性与创新引导下的理性应用
据开发者@图灵的猫 介绍,对话中的这位Henry骗子哥,只是主动找上“小源”的其中一位聊天对象,还有13位“嫌疑诈骗分子”,这个数字还是在开发者已经进行了一波筛选之后。
小源完美的待嫁单身女生形象,吸引了无数人,私信爆炸。可以想象,同样条件的人类女生在社交网站上是多么危机四伏,随时都可能成为受害对象。
人类和AI的最大不同在于,多数时候人类的感性是占据上风的,做不到AI那样的绝对理性,所以才会不知不觉间落入圈套。
但正是这样感性的驱动下,AI在我们日常生产生活所发挥的空间才无穷,因为人工智能等先进技术的本质仍是工具,而工具所谓的善恶倾向则取决于人类的出发点。
就如同@图灵的猫 这样的开发者因为身边有遇到过杀猪盘的朋友们,进而义愤填膺基于“源1.0”大模型开发出AI反诈“工具人”小源,提醒广大女性提高警惕性,注意防范网络上的陌生人。
人类善用AI的智慧定会胜过日益强大的AI技术。
如今,人工智能已经从点到面渗透到更多行业、更多领域的各类场景,创新不断。作为通用的巨量中文AI模型,“源1.0”具备优秀的自然语言理解和自然语言生成的能力,可以作为新一代认知智能的引擎,适应广泛的下游AI任务,自开源问世以来,不少开发者和相关机构都基于此进行了诸多创新应用。
“源1.0”可以完成各种风格、类型文本的生成,如新闻资讯、金融行研、办公公文、法律文书、广告营销、网络文学、诗词歌赋、食谱菜谱等。
超1000家用户,采用“源1.0”提供的数据和API显著提升了金融、互联网、医疗和自动驾驶等行业应用的精度;
源1.0已经与多个行业用户开展深度合作,支持手机智能语音助手、大型互联网翻译平台等应用的AI智能化升级……
除了这些相对“常规”的操作,不少开源社区的开发者们通过源1.0的开放开源平台进行了创意实现。
在文娱方面,一群来自上海学生开发者创作的“AI剧本杀”就是其中代表,曾在GitHub引发热烈讨论。
Github链接:
https://github.com/bigbrother666sh/shezhangbujianle
在心理辅导方面,自香港浸会大学社会工作系副教授 陈智达教授负责的运用AI模拟求助者支援社会服务工作者培训项目。
在上述案例中,AI在不同领域以意想不到的方式发挥着自己的潜力,也帮助着诉求不同的开发者们拓宽创新的边界。这些创新想法或许早就出现在他们富有想象力的脑海中,而将“灵光乍现”变成可实现、可落地的应用,很大程度上需归功于外部技术环境的变化,例如,如今以“源1.0”为代表的大模型已经成为人工智能算法基础设施,正在普惠千行百业。
事实上,创新往往并非无中生有的顿悟,而是某一领域发展到一定阶段、厚积薄发的涌现,技术是向善的工具,亦是创新萌发的沃土。
微信扫码关注该文公众号作者