avatar
问一道Google面试题# JobHunting - 待字闺中
d*8
1
有一个很大的文件,里面有很多文本,文本里会出现很多人名(full name)。
设计一个算法,把里面的所有人名找出来存到另一个数据结构里去。
谢谢
avatar
a*9
2
是要去掉重复的人名的意思么?
可以考虑用MapReduce来做, 挺合适的

【在 d***8 的大作中提到】
: 有一个很大的文件,里面有很多文本,文本里会出现很多人名(full name)。
: 设计一个算法,把里面的所有人名找出来存到另一个数据结构里去。
: 谢谢

avatar
d*8
3
怎么从文本(可能有很多句子在里面)里面把人名找出来?
用正则表达式吗?
avatar
p*n
4
你总有一个人名的字典吧,每看到一个单词,看看是不是在这个字典里面,如果是的话
就标记一下,然后都是人名的邻接单
词都放到一个哈希表存起来。如果人名实在太多(比如说上亿),那只能分成几个区,
分别处理。

【在 d***8 的大作中提到】
: 怎么从文本(可能有很多句子在里面)里面把人名找出来?
: 用正则表达式吗?

avatar
g*s
5
这什么题啊?描述太模糊了。

【在 d***8 的大作中提到】
: 有一个很大的文件,里面有很多文本,文本里会出现很多人名(full name)。
: 设计一个算法,把里面的所有人名找出来存到另一个数据结构里去。
: 谢谢

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。