avatar
d*e
2
【 以下文字转载自 Oklahoma 讨论区 】
发信人: motbbs (motbbs), 信区: Oklahoma
标 题: 死亡人数肯定要超过100,大家一点都不关心吗
发信站: BBS 未名空间站 (Tue May 21 00:53:07 2013, 美东)
好像对这件事大家都没啥反应啊
avatar
e*e
3
好眼力,没PS
avatar
l*s
4
600
avatar
l*u
5
直接refresh

【在 e******e 的大作中提到】
: 好眼力,没PS
avatar
c*7
6
每次我都纳闷,想出来这个码的人,是不是自己长了八只眼睛。
能看出来这个是啥不?
avatar
s*r
7
圡人,
这是一个CMU的计算机教授发明出来的东西,这些图片其实是图书馆扫描出来的珍稀书
籍里面的不能被机器识别的字符。一般有两个,一个是已经被识别出来的,一个是未被
识别出来的。当提交者试图认出这两个单词时,程序通过那个已经识别出来的单词来验
证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
。如果提交者选择“看不清”,那就证明这两个单词真的不能被人工认出来。
avatar
c*7
8
好学术啊。
众圡人快随我一同膜拜。

【在 s********r 的大作中提到】
: 圡人,
: 这是一个CMU的计算机教授发明出来的东西,这些图片其实是图书馆扫描出来的珍稀书
: 籍里面的不能被机器识别的字符。一般有两个,一个是已经被识别出来的,一个是未被
: 识别出来的。当提交者试图认出这两个单词时,程序通过那个已经识别出来的单词来验
: 证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
: 。如果提交者选择“看不清”,那就证明这两个单词真的不能被人工认出来。

avatar
e*s
9
I don't buy it.
http://en.wikipedia.org/wiki/CAPTCHA
NO pp NO truth.

【在 s********r 的大作中提到】
: 圡人,
: 这是一个CMU的计算机教授发明出来的东西,这些图片其实是图书馆扫描出来的珍稀书
: 籍里面的不能被机器识别的字符。一般有两个,一个是已经被识别出来的,一个是未被
: 识别出来的。当提交者试图认出这两个单词时,程序通过那个已经识别出来的单词来验
: 证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
: 。如果提交者选择“看不清”,那就证明这两个单词真的不能被人工认出来。

avatar
e*s
11
thanks!
it is REALLY cool!

【在 j*****z 的大作中提到】
: 你搜错了,他说的那个CMU的:
: http://en.wikipedia.org/wiki/ReCAPTCHA
: google基本都是用这个,还有很多网盘都是,基本上想破解的人都是直接放弃的。

avatar
h*u
12
机器怎么知道某个单词不能识别

【在 s********r 的大作中提到】
: 圡人,
: 这是一个CMU的计算机教授发明出来的东西,这些图片其实是图书馆扫描出来的珍稀书
: 籍里面的不能被机器识别的字符。一般有两个,一个是已经被识别出来的,一个是未被
: 识别出来的。当提交者试图认出这两个单词时,程序通过那个已经识别出来的单词来验
: 证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
: 。如果提交者选择“看不清”,那就证明这两个单词真的不能被人工认出来。

avatar
C*g
13
既然他识别不出来,又怎么知道你是否识别对了呢?
你摸着石头过河,咋预先知道自己的路线是正确的呢?

【在 h*******u 的大作中提到】
: 机器怎么知道某个单词不能识别
avatar
P*k
14
大概同一个单词会让多个人识别吧
avatar
s*r
15
楼上的请再看一遍我的帖子。
有两个单词,有一个是机器已经认出来的。提交者输入两个单词时,机器只检验那个已
经被识别出来的单词是否正确,如果是,那么机器假定那个不认识的单词也被正确的认
出来了,机器把它保存下来。下一个提交者再认一遍那个不认识的单词。如果很多提交
者认出来的结果都一样,就可以认定那个机器不认识的单词被人认出来了。
avatar
T*e
16
temporary, 这你们都看不出来吗?
avatar
s*a
17
不是拿了天才奖么
我还看过他发的science paper
一作是undergrad

【在 s********r 的大作中提到】
: 圡人,
: 这是一个CMU的计算机教授发明出来的东西,这些图片其实是图书馆扫描出来的珍稀书
: 籍里面的不能被机器识别的字符。一般有两个,一个是已经被识别出来的,一个是未被
: 识别出来的。当提交者试图认出这两个单词时,程序通过那个已经识别出来的单词来验
: 证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
: 。如果提交者选择“看不清”,那就证明这两个单词真的不能被人工认出来。

avatar
h*u
18
我问的是在提供这种服务的最初始阶段,机器是怎么发现有些单词无法识别,从而提供
给用户人工识别的。也就是说在OCR过程中怎样发现有些单词识别错误的。

【在 s********r 的大作中提到】
: 楼上的请再看一遍我的帖子。
: 有两个单词,有一个是机器已经认出来的。提交者输入两个单词时,机器只检验那个已
: 经被识别出来的单词是否正确,如果是,那么机器假定那个不认识的单词也被正确的认
: 出来了,机器把它保存下来。下一个提交者再认一遍那个不认识的单词。如果很多提交
: 者认出来的结果都一样,就可以认定那个机器不认识的单词被人认出来了。

avatar
h*u
19
再有,这组校验码包含一个不可OCR单词和一个可OCR单词,由于服务器本身不能对前一
个自校验,爬网的机器人只要对这组词ocr就很容易攻破识别码,是不是这样?

【在 s********r 的大作中提到】
: 楼上的请再看一遍我的帖子。
: 有两个单词,有一个是机器已经认出来的。提交者输入两个单词时,机器只检验那个已
: 经被识别出来的单词是否正确,如果是,那么机器假定那个不认识的单词也被正确的认
: 出来了,机器把它保存下来。下一个提交者再认一遍那个不认识的单词。如果很多提交
: 者认出来的结果都一样,就可以认定那个机器不认识的单词被人认出来了。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。