avatar
问一个Big Data的问题# JobHunting - 待字闺中
n*l
1
用paypal打印的usps first class的label
输入的时候, 地址里面有些东西, 打印出来的label就是没有. 不知道为什么
请问, 能否打印完了, 自己用铅笔在地址后面补写一些地址?
不知道这样可否? usps会否按照我的补写地址寄?
avatar
p*6
2
One design question from a big data start up.
Suppose you have a big file with 1 billion of record, each entry is a key
value pair of name and numbers. names can be duplicate, but numbers are
unique and names are sorted in the file.
Give you 100 machine, design a way to query records by number, and modify/
insert a record.
avatar
m*r
3
yes
why not?

【在 n***l 的大作中提到】
: 用paypal打印的usps first class的label
: 输入的时候, 地址里面有些东西, 打印出来的label就是没有. 不知道为什么
: 请问, 能否打印完了, 自己用铅笔在地址后面补写一些地址?
: 不知道这样可否? usps会否按照我的补写地址寄?

avatar
r*s
4
这么简单的问题
你把1b的number hash到100台机器上,然后建立一个hash value-> host的mapping在
master node不就行了?
如果复杂一点,这1b还能继续grow, 自己找consistent hashing看看。
avatar
d*1
5
可以
avatar
m*l
6
你这么做显然没考虑很多东西。比如分布式系统的冗余问题。

【在 r****s 的大作中提到】
: 这么简单的问题
: 你把1b的number hash到100台机器上,然后建立一个hash value-> host的mapping在
: master node不就行了?
: 如果复杂一点,这1b还能继续grow, 自己找consistent hashing看看。

avatar
w*r
7
wow,这个要大牛才能解啊
avatar
p*6
8
这道题的难点是query by value 而不是key, 但是要求增的时候key是排序的。
这是一个open question,集思广益。
avatar
g*g
9
Put it in C* DB, number as key, done. Want redundancy? Use RF>1, done.
avatar
z*e
10
看看column-based nosql db
天生就是按value做index的
比如楼上说的cassandra还有hbase

【在 p****6 的大作中提到】
: 这道题的难点是query by value 而不是key, 但是要求增的时候key是排序的。
: 这是一个open question,集思广益。

avatar
c*l
11
what's C* DB?

【在 g*****g 的大作中提到】
: Put it in C* DB, number as key, done. Want redundancy? Use RF>1, done.
avatar
c*r
12
mark
avatar
x*n
13
hbase只有对key做index。你想快速搜索别的column需要solr或者elasticsearch做的,
或者solr/elasticsearch混合hbase做。
cassandra不了解

【在 z****e 的大作中提到】
: 看看column-based nosql db
: 天生就是按value做index的
: 比如楼上说的cassandra还有hbase

avatar
l*t
14
靠谱。
啥出的这种缺德的面试题呀。

【在 x*****n 的大作中提到】
: hbase只有对key做index。你想快速搜索别的column需要solr或者elasticsearch做的,
: 或者solr/elasticsearch混合hbase做。
: cassandra不了解

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。