网络验证码总填错?利用人类训练AI,网友都在替巨头负重前行
如今每登录一个网站,“请完成以下人机验证程序”似乎是必不可少的一步。
点击包含所有红灯或公交车的图片,输入一系列看起来变形扭曲的小字母和难以辨认的数字……
无法一次性顺利完成验证任务的网友,想必小编应该不是唯一一个吧。
填验证码,对一些人来说是一种受难,对另一些人来说是一种头痛,总之,它考验着人类的耐心,折磨着人类的身心。
“我觉得验证码让人深感不快,因为字母和数字总是写得像一年级的孩子第一天上学一样,”数据公司的项目经理大卫说,尽管他不得不习惯这种程序。
自2010年代初出现以来,Captcha(用于区分计算机和人类的全自动公共图灵测试)通过自动区分人类和计算机程序,一直在努力完成使命。
当然,在与用户产生一些摩擦的同时,该测试也并非完全没有问题。
法国Check Point公司的网络安全顾问阿德里安·梅维尔(Adrien Merveille)说:“这是一种变相的繁琐,因为许多计算机程序都会扫描互联网,以寻找网站或服务的漏洞。”
Captcha程序的第一个功能,是为“机器人”设定规则。
一旦这些软件机器人蒙混过关,带给互联网的风险是什么?创建大量虚假账户,制造混乱,或者是在没有最低限度过滤的网站上传播骚扰和垃圾广告。
这些软件机器人能够阅读基本的字母序列,但它们并不总是能够区分不同的风格或颜色。
通过Captcha,便可以最大限度地识别和拦截它们,维持网络秩序。
验证码是由美国学者发明的“邪恶”工具,然后由谷歌以其重新制作的双字版本reCAPTCHA加以推广。它在网络上的无所不在归功于一个周密的战略。
F5网络公司的技术总监和网络安全专家阿尔诺·勒梅尔(Arnaud Lemaire)解释了验证码的“发家史”。
“刚开始,他们为所有网站免费提供这种筛查机器人的方案,并提供易于使用的应用程序接口(API)。”
但随着越来越多网站开始使用这个程序,事情的走向出现了一丝诡异。
开发程序的谷歌公司在运用这个程序时,找到了一石二鸟的双重优势:确保其搜索引擎运用网站的安全性,同时,让必须使用这个程序互联网用户做出贡献。
直到2012年,数以亿计的人在使用reCAPTCHA程序来识别字符。reCAPTCHA很快开始推出识别卡车或地址标志的图像来验证真人的步骤,而这些图像都被用来完善谷歌街景地图的人工智能系统了。
这似乎也解释了,为什么reCaptcha有时并不是非常好用。比如大家应该都遇到过,根本看不出验证码或者看不清图片里到底是什么内容的时候。
但是要想摆脱因接触验证码而产生的挫折感,科技人员还需要更多的努力。
点「在看」为我们打call ▽
微信扫码关注该文公众号作者