问一道data engineer面试题,跪求答案# JobHunting - 待字闺中
i*n
1 楼
有A与B两个集合,每个集合各含有million个data point,每个data point由thousand
个feature描述,不过有的feature是missing的或者残缺不全的。已知有一个方程f(a,b
)可以判断两个data point a和b是否equivalent,问题是如何最efficient的找出A与B
中的所有equivalent的data point对。
跪求答案。
个feature描述,不过有的feature是missing的或者残缺不全的。已知有一个方程f(a,b
)可以判断两个data point a和b是否equivalent,问题是如何最efficient的找出A与B
中的所有equivalent的data point对。
跪求答案。