avatar
请教一道L家系统难题# JobHunting - 待字闺中
a*b
1
题目:
要把100g的数据(很多小文件)复制到10000台机器上,怎样做最好?如何保证数据传
输的一致性?
最近L家面试的时候有被问到,感觉完全回答不到点子上,不知道面试官想考察哪个方
面。既然只有10000个机器,是不是一个机器写个loop scp就可以了?然后scp完了直接
cksum对比?大牛们帮忙分析分析
类似的一道经典题
设计题,传输10G的data到5个data center,每个data center 有1000的节点
avatar
d*n
2
其实就是考你到底要存几份,然后怎么存在几台机器上的。例如你说前100个文件都存
前10台电脑,这当然可以,但是不见得最安全。如果是这个参考cassandra的实现就可
以了,具体和读写模式有关。

【在 a******b 的大作中提到】
: 题目:
: 要把100g的数据(很多小文件)复制到10000台机器上,怎样做最好?如何保证数据传
: 输的一致性?
: 最近L家面试的时候有被问到,感觉完全回答不到点子上,不知道面试官想考察哪个方
: 面。既然只有10000个机器,是不是一个机器写个loop scp就可以了?然后scp完了直接
: cksum对比?大牛们帮忙分析分析
: 类似的一道经典题
: 设计题,传输10G的data到5个data center,每个data center 有1000的节点

avatar
a*b
3
可能我意思没说清楚,他说目的是每个机器都有完整的100G 数据,不是paritition或
者sharding,我就没搞懂这里,那不是直接start 10000个 scp session 直接copy不就
完了?还是我理解错了

【在 d****n 的大作中提到】
: 其实就是考你到底要存几份,然后怎么存在几台机器上的。例如你说前100个文件都存
: 前10台电脑,这当然可以,但是不见得最安全。如果是这个参考cassandra的实现就可
: 以了,具体和读写模式有关。

avatar
w*e
4
显然用rsync更好。
而且,用雪崩方式拷贝,效率要高一点吧。
1->2->4->8->...

【在 a******b 的大作中提到】
: 题目:
: 要把100g的数据(很多小文件)复制到10000台机器上,怎样做最好?如何保证数据传
: 输的一致性?
: 最近L家面试的时候有被问到,感觉完全回答不到点子上,不知道面试官想考察哪个方
: 面。既然只有10000个机器,是不是一个机器写个loop scp就可以了?然后scp完了直接
: cksum对比?大牛们帮忙分析分析
: 类似的一道经典题
: 设计题,传输10G的data到5个data center,每个data center 有1000的节点

avatar
g*e
5
L家题库里没有这个题
avatar
a*b
6
噢!谢谢提示,确实RSYNC更好,
能否详细解释下雪崩方式拷贝和实现方式?有没有文章详细解释下?

【在 w*******e 的大作中提到】
: 显然用rsync更好。
: 而且,用雪崩方式拷贝,效率要高一点吧。
: 1->2->4->8->...

avatar
a*b
7
SRE 电面的

【在 g*********e 的大作中提到】
: L家题库里没有这个题
avatar
s*3
8
大牛能说说吗 想知道...

【在 w*******e 的大作中提到】
: 显然用rsync更好。
: 而且,用雪崩方式拷贝,效率要高一点吧。
: 1->2->4->8->...

avatar
t*u
9
就是已经copy的可以作为其他的源
avatar
a*i
10
https://vimeo.com/11280885
这个?

【在 a******b 的大作中提到】
: 噢!谢谢提示,确实RSYNC更好,
: 能否详细解释下雪崩方式拷贝和实现方式?有没有文章详细解释下?

avatar
f*t
11
P2P不就行了
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。