问个大数据的问题# DataSciences - 数据科学
m*h
1 楼
问个大数据的问题,
假设我有一个sensor,接受streaming data, 数据进来以后就process(一些general
的 signal processing, filtering, feature extracting), 目的是anormaly
detection, 所以输出是whether or not abormaly is detected. 这些是算法问题,可
以解决。
现在的问题是如果我有1 million 这样的sensor, 相互之间是独立的,每个sensor
streaming进来自己的data, 同样的data processing 算法来对它自己收到的data 做
anormaly detection。
怎么才能让这个big data 问题最优化? 怎么设计系统和平行算法?
我本人做算法,不是data scientist, 所以请教大牛们! 谢谢!
假设我有一个sensor,接受streaming data, 数据进来以后就process(一些general
的 signal processing, filtering, feature extracting), 目的是anormaly
detection, 所以输出是whether or not abormaly is detected. 这些是算法问题,可
以解决。
现在的问题是如果我有1 million 这样的sensor, 相互之间是独立的,每个sensor
streaming进来自己的data, 同样的data processing 算法来对它自己收到的data 做
anormaly detection。
怎么才能让这个big data 问题最优化? 怎么设计系统和平行算法?
我本人做算法,不是data scientist, 所以请教大牛们! 谢谢!