g*e
2 楼
Fuzzy/Approximate string matching,实际应用很广泛。
有一堆target string。给定一个新的string,要从target string里面找出拼写/发音
类似的。如何scale?
答每次计算levenshtein distance的不及格
答soundex的及格
答用lucene的直接拖出去
有一堆target string。给定一个新的string,要从target string里面找出拼写/发音
类似的。如何scale?
答每次计算levenshtein distance的不及格
答soundex的及格
答用lucene的直接拖出去
S*n
4 楼
那把计算过levenshtein distance的存起来呢?
第一次计算一下,以后要么从内存中直接读要么从disk上读行不行?
我今天被问到spell checking,这样答了,是不是要废掉了?
第一次计算一下,以后要么从内存中直接读要么从disk上读行不行?
我今天被问到spell checking,这样答了,是不是要废掉了?
y*g
6 楼
soundex 闻所未闻啊,,太专业了
S*n
9 楼
我觉得常用单词不是很多,由这些单词产生的错误拼写也不会有多少,存起来应该没多
大吧
大吧
x*y
12 楼
Locality senstivit hashing
x*0
15 楼
mark
相关阅读
千老刷试管和码农刷LC题哪个更苦?Speech+NLP我觉得这个版用卡通头像的人思想健康,业余爱好良好为啥不在每个公司搞个“华人协会”啥的组织年底前刷PXJ到400,读完yarn和zookeeper代码!感觉烙印团结是有原因的leetcode 这包裹算什么水平?潜水的大牛们应该比地里的年长至少十岁吧?Google 有frequency的 还有10题hard紧急求助 H1B 60 Days Grace Period 三周到期,怎么办?提供google内推谷歌爸爸:和污勃战斗到底fb的ranking team怎么样?现在有头有脸的互联网公司,哪家不考刷题很多清华的去ITU是什么路子大部分CS毕业都是找software developer的工作吗?大学同学创业几年了求内推如果面试就是比刷题,那是不是根本不用学啥技术有人在Ripple上班的吗?