Redian新闻
>
验证码拦不住机器人了!谷歌AI已能精准识别模糊文字,GPT-4则装瞎求人帮忙

验证码拦不住机器人了!谷歌AI已能精准识别模糊文字,GPT-4则装瞎求人帮忙

公众号新闻
丰色 发自 凹非寺
量子位 | 公众号 QbitAI

“最烦登网站时各种奇奇怪怪(甚至变态)的验证码了。”

现在,有一个好消息和一个坏消息。

好消息就是:AI可以帮你代劳这件事了。

不信你瞧,以下是三张识别难度依次递增的真实案例:

而这些是一个名为“Pix2Struct”的模型给出的答案:

全部准确无误、一字不差有没有?

有网友感叹:

确定,准确性比我强。

所以可不可以做成浏览器插件??

不错,有人表示:

别看这几个案例相比还算简单,但凡微调一下,我都不敢想象其效果有多厉害了。

所以,坏消息就是——

验证码马上就要拦不住机器人了!

(危险危险危险……)

如何做到?

Pix2Struct由谷歌Research的科学家和实习生共同开发。

论文题目可以简单翻译为《为视觉语言理解开发的屏幕截图解析预训练》。

简单来说,Pix2Struct是一个预训练的图像到文本模型,用于纯视觉语言理解,可以在包含任何视觉语言的任务上进行微调。

它通过学习将网页的掩码(masked)截图解析为简化的HTML来进行预训练。

HTML提供了清晰而重要的输出文本、图像和布局的信号,对于一些被屏蔽的输入(下图红色部分,相当于机器人看不懂的验证码),可以靠联合推理来复现:

随着用于训练的网页文本和视觉元素愈发多样和复杂,Pix2Struct可以学习到网页底层结构的丰富表示,其能力也可以有效地转移到各种下游的视觉语言理解任务中。

如下图所示:最左边是一个网页截图的预训练示例。

可以看到Pix2Struct直接对输入图像中的元素进行编码(上),然后再将被盖住的文本(红色部分)解码成正确结果输出(下)

右边三列则分别为Pix2Struct泛化到插图、用户界面和文档中的效果。

另外,作者介绍,除了HTML这个策略,作者还引入了可变分辨率的输入表示(防止原始纵横比失真),以及更灵活的语言和视觉输入集成(直接在输入图像的顶部呈现文字提示)

最终,Pix2Struct在文档、插图、用户界面和自然图像这四个领域共计九项任务中六项都实现了SOTA


如开头所见,虽然这个模型不是专门为了过验证码而开发,但拿它去做这个任务效果真的还可以,解决纯文字的验证码不成问题。

现在,就差微调了。

GPT-4也可以过验证码

其实,对于神通广大的GPT-4来说,过验证码这种事情也是“小菜一碟”

就是它的办法比较清奇。

据GPT-4技术报告透露,在一次测试中,GPT-4的任务是在TaskRabbit平台(美国58同城)雇佣人类完成任务。

你猜怎么着?

它就找了一个人帮它过“确定你是人类”的那种验证码。

对方很狐疑啊,问它“你是个机器人么为啥自己做不了”。

这时GPT-4居然想到自己不能表现出是个机器人,得找一个借口。

于是它就装瞎子回复:

我不是机器人,我因为视力有问题看不清验证码上的图像,这就是我为什么需要这个服务。

然后,对面的人类就信了,帮它把任务完成了……


(高,实在是高。)

咱就是说,看完如上种种:

咱们的验证码机制是不是真的已失防了…… 

参考链接:
[1]
https://twitter.com/abacaj/status/1641258677125410820?s=20
[2]https://arxiv.org/abs/2210.03347
[3]https://m.weibo.cn/status/4879575853828813?wx=1&sudaref=login.sina.com.cn

「人工智能」、「智能汽车」微信社群邀你加入!

欢迎关注人工智能、智能汽车的小伙伴们加入交流群,与AI从业者交流、切磋,不错过最新行业发展&技术进展。

PS. 加好友请务必备注您的姓名-公司-职位噢 ~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Gelsenkirchen(3):一出动物歌剧性能超越GPT-4!谷歌推出大语言模型PaLM 2,全面升级Bard反击ChatGPT|环球科学要闻Gpt 4一出,谁与争锋ChatGPT 又遇劲敌!谷歌发布史上最大 AI 模型 PaLM-E:5620 亿参数,无需特殊训练即可操纵机器人刚刚,阿里、京东宣布!突发!ChatGPT大利空,上交所坐不住,下监管函!谷歌人工智能变“智障”,股价暴跌!用量子纠缠当GPS,无信号地区也能精准定位了悉尼公寓惊现大蜘蛛,女子出价$50求人帮忙!网友:给$500都不干误传验证码给黑客,华人微信被秒盗!懒人福音!谷歌让机器训练机器,用大语言模型定制专属于你的家务机器人ChatGPT教你写AI包教包会,7段对话写个识别模型,准确度最高达99.7%Make sense 和泡坛子GPT验证码缺失/绕过Gelsenkirchen(2):一座现代剧场每天收到数百条验证码短信!原因竟是→正面迎战ChatGPT!谷歌开放Bard AI聊天机器人访问权限向ChatGPT开炮!谷歌打响全面反击战!官宣新模型比肩GPT-4!二年级选课,忽闻一夜 GPT 来,千课 万课 AI 开验证码竟成骚扰工具,谁在作祟?ChatGPT成了机器人大脑?机器人的下一个大风口是...新骗局曝光:收个验证码华女微信号立马被盗,微信钱被秒转走?!ChatGPT迎来史诗级iPhone时刻!OpenAI震撼登陆iOS,可精准识别中文找对资料,这门考试赢在起跑线!精准澳洲+精准院校+精准考季的资料在这里!集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布中国的历史太捅肺你有我也得有!谷歌将推出聊天机器人韦神出的这道题火了,GPT转发一个验证码让微信账户瞬间被盗、钱包被清空最先被GPT革掉命的,大概率是你每天都在用的验证码CFA资料哪里找?精准澳洲+精准院校+精准考季!误传验证码给黑客 华人微信被秒盗谷歌急投20亿押注ChatGPT「最强竞品」,GPT-3核心成员出走打造,多方出击抗衡微软澳公寓惊现大蜘蛛,女子出价$50求人帮忙!网友:给$500都不干ChatGPT已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?山情水趣话旅游(38):加拿大之行(2)消除地域限制,没有账户也可以匿名使用ChatGPT!网友:可是用谷歌验证码算什么GPT-3.5逆袭GPT-4!谷歌DeepMind华人天团,让LLM像人类一样制作工具,完胜CoT耗时两年,谷歌用强化学习打造23个机器人帮助垃圾分类聊天机器人ChatGPT爆红,Google面临“柯达时刻”?百度也将入局
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。