史上最难的识别码 - 未名空间MITBBS历史存档

c*m2011-04-05 07:04

1 楼

大家都买哪一款？
谢谢

d*e2011-04-05 07:04

2 楼

【以下文字转载自 Oklahoma 讨论区】
发信人: motbbs (motbbs), 信区: Oklahoma
标题: 死亡人数肯定要超过100，大家一点都不关心吗
发信站: BBS 未名空间站 (Tue May 21 00:53:07 2013, 美东)
好像对这件事大家都没啥反应啊

e*e2011-04-05 07:04

3 楼

好眼力，没PS

l*s2011-04-05 07:04

4 楼

600

l*u2011-04-05 07:04

5 楼

直接refresh

【在 e******e 的大作中提到】

: 好眼力，没PS

c*72011-04-05 07:04

6 楼

每次我都纳闷，想出来这个码的人，是不是自己长了八只眼睛。
能看出来这个是啥不？

s*r2011-04-05 07:04

7 楼

圡人，
这是一个CMU的计算机教授发明出来的东西，这些图片其实是图书馆扫描出来的珍稀书
籍里面的不能被机器识别的字符。一般有两个，一个是已经被识别出来的，一个是未被
识别出来的。当提交者试图认出这两个单词时，程序通过那个已经识别出来的单词来验
证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
。如果提交者选择“看不清”，那就证明这两个单词真的不能被人工认出来。

c*72011-04-05 07:04

8 楼

好学术啊。
众圡人快随我一同膜拜。

【在 s********r 的大作中提到】

: 圡人，
: 这是一个CMU的计算机教授发明出来的东西，这些图片其实是图书馆扫描出来的珍稀书
: 籍里面的不能被机器识别的字符。一般有两个，一个是已经被识别出来的，一个是未被
: 识别出来的。当提交者试图认出这两个单词时，程序通过那个已经识别出来的单词来验
: 证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
: 。如果提交者选择“看不清”，那就证明这两个单词真的不能被人工认出来。

e*s2011-04-05 07:04

9 楼

I don't buy it.
http://en.wikipedia.org/wiki/CAPTCHA
NO pp NO truth.

【在 s********r 的大作中提到】

: 圡人，
: 这是一个CMU的计算机教授发明出来的东西，这些图片其实是图书馆扫描出来的珍稀书
: 籍里面的不能被机器识别的字符。一般有两个，一个是已经被识别出来的，一个是未被
: 识别出来的。当提交者试图认出这两个单词时，程序通过那个已经识别出来的单词来验
: 证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
: 。如果提交者选择“看不清”，那就证明这两个单词真的不能被人工认出来。

j*z2011-04-05 07:04

10 楼

你搜错了，他说的那个CMU的：
http://en.wikipedia.org/wiki/ReCAPTCHA
google基本都是用这个，还有很多网盘都是，基本上想破解的人都是直接放弃的。

【在 e*******s 的大作中提到】

: I don't buy it.
: http://en.wikipedia.org/wiki/CAPTCHA
: NO pp NO truth.

e*s2011-04-05 07:04

11 楼

thanks!
it is REALLY cool!

【在 j*****z 的大作中提到】

: 你搜错了，他说的那个CMU的：
: http://en.wikipedia.org/wiki/ReCAPTCHA
: google基本都是用这个，还有很多网盘都是，基本上想破解的人都是直接放弃的。

h*u2011-04-05 07:04

12 楼

机器怎么知道某个单词不能识别

【在 s********r 的大作中提到】

: 圡人，
: 这是一个CMU的计算机教授发明出来的东西，这些图片其实是图书馆扫描出来的珍稀书
: 籍里面的不能被机器识别的字符。一般有两个，一个是已经被识别出来的，一个是未被
: 识别出来的。当提交者试图认出这两个单词时，程序通过那个已经识别出来的单词来验
: 证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
: 。如果提交者选择“看不清”，那就证明这两个单词真的不能被人工认出来。

C*g2011-04-05 07:04

13 楼

既然他识别不出来，又怎么知道你是否识别对了呢？
你摸着石头过河，咋预先知道自己的路线是正确的呢？

【在 h*******u 的大作中提到】

: 机器怎么知道某个单词不能识别

P*k2011-04-05 07:04

14 楼

大概同一个单词会让多个人识别吧

s*r2011-04-05 07:04

15 楼

楼上的请再看一遍我的帖子。
有两个单词，有一个是机器已经认出来的。提交者输入两个单词时，机器只检验那个已
经被识别出来的单词是否正确，如果是，那么机器假定那个不认识的单词也被正确的认
出来了，机器把它保存下来。下一个提交者再认一遍那个不认识的单词。如果很多提交
者认出来的结果都一样，就可以认定那个机器不认识的单词被人认出来了。

T*e2011-04-05 07:04

16 楼

temporary, 这你们都看不出来吗？

s*a2011-04-05 07:04

17 楼

不是拿了天才奖么
我还看过他发的science paper
一作是undergrad

【在 s********r 的大作中提到】

: 圡人，
: 这是一个CMU的计算机教授发明出来的东西，这些图片其实是图书馆扫描出来的珍稀书
: 籍里面的不能被机器识别的字符。一般有两个，一个是已经被识别出来的，一个是未被
: 识别出来的。当提交者试图认出这两个单词时，程序通过那个已经识别出来的单词来验
: 证那个未被识别的单词是否真的被提交者认出来了。整个这个程序都得到了基金的资助
: 。如果提交者选择“看不清”，那就证明这两个单词真的不能被人工认出来。

h*u2011-04-05 07:04

18 楼

我问的是在提供这种服务的最初始阶段，机器是怎么发现有些单词无法识别，从而提供
给用户人工识别的。也就是说在OCR过程中怎样发现有些单词识别错误的。

【在 s********r 的大作中提到】

: 楼上的请再看一遍我的帖子。
: 有两个单词，有一个是机器已经认出来的。提交者输入两个单词时，机器只检验那个已
: 经被识别出来的单词是否正确，如果是，那么机器假定那个不认识的单词也被正确的认
: 出来了，机器把它保存下来。下一个提交者再认一遍那个不认识的单词。如果很多提交
: 者认出来的结果都一样，就可以认定那个机器不认识的单词被人认出来了。

h*u2011-04-05 07:04

19 楼

再有，这组校验码包含一个不可OCR单词和一个可OCR单词，由于服务器本身不能对前一
个自校验，爬网的机器人只要对这组词ocr就很容易攻破识别码，是不是这样？

【在 s********r 的大作中提到】

: 楼上的请再看一遍我的帖子。
: 有两个单词，有一个是机器已经认出来的。提交者输入两个单词时，机器只检验那个已
: 经被识别出来的单词是否正确，如果是，那么机器假定那个不认识的单词也被正确的认
: 出来了，机器把它保存下来。下一个提交者再认一遍那个不认识的单词。如果很多提交
: 者认出来的结果都一样，就可以认定那个机器不认识的单词被人认出来了。