d*d
2 楼
面试的时间被问到的,感觉当时答的不太好,上来请教一下大家。
问题是这样的,
有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
出了问题。
我当时的回答是这样的:
从变量2入手,找出每个时间段,比如每个一秒钟之内变量2 的变化差值,看看变量1在
这段时间内的变化差值,然后遍历所有的相同的变量2的变化差值,看看哪一个变量1
的变化差值是最大的。就是比如
一分钟之内,60个变量2的变化差值都是1,或者2,相对应的变量1的变化差值如果都是
在256或者512之内,那么这是时间值就是好的,但是如果超出了这个范围很多,就意味
着有问题。面试官看起来不太满意,因为到时间了,就没有再聊下去了。
问题是这样的,
有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
出了问题。
我当时的回答是这样的:
从变量2入手,找出每个时间段,比如每个一秒钟之内变量2 的变化差值,看看变量1在
这段时间内的变化差值,然后遍历所有的相同的变量2的变化差值,看看哪一个变量1
的变化差值是最大的。就是比如
一分钟之内,60个变量2的变化差值都是1,或者2,相对应的变量1的变化差值如果都是
在256或者512之内,那么这是时间值就是好的,但是如果超出了这个范围很多,就意味
着有问题。面试官看起来不太满意,因为到时间了,就没有再聊下去了。
c*3
3 楼
曲线都是连续平滑的,画出图,看看哪里有锯齿,就有问题了。
c*e
6 楼
这种问题一般是问刚毕业的学生的,有工作经验的不会问这种抽象的问题。
【在 d**d 的大作中提到】
: 面试的时间被问到的,感觉当时答的不太好,上来请教一下大家。
: 问题是这样的,
: 有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
: 是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
: 余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
: 有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
: 个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
: 传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
: 出了问题。
: 我当时的回答是这样的:
【在 d**d 的大作中提到】
: 面试的时间被问到的,感觉当时答的不太好,上来请教一下大家。
: 问题是这样的,
: 有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
: 是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
: 余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
: 有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
: 个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
: 传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
: 出了问题。
: 我当时的回答是这样的:
v*o
7 楼
富里叶变换,相关性分析?
z*k
8 楼
这种随机过程要从概率分布上分析,你的情况就是要在两个信号变量的联合分布函数
(数值表示)上考虑,联合分布当然是2D。用那个基于普世的时间序列随机特征理想化,
再用这个联合分布函数就可算出来错在哪些点了。
【在 d**d 的大作中提到】
: 面试的时间被问到的,感觉当时答的不太好,上来请教一下大家。
: 问题是这样的,
: 有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
: 是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
: 余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
: 有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
: 个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
: 传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
: 出了问题。
: 我当时的回答是这样的:
(数值表示)上考虑,联合分布当然是2D。用那个基于普世的时间序列随机特征理想化,
再用这个联合分布函数就可算出来错在哪些点了。
【在 d**d 的大作中提到】
: 面试的时间被问到的,感觉当时答的不太好,上来请教一下大家。
: 问题是这样的,
: 有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
: 是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
: 余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
: 有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
: 个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
: 传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
: 出了问题。
: 我当时的回答是这样的:
p*o
9 楼
因为你的数据是连续变化的,所以一阶difference后,对绝对值做一个回归。残差大的
就是有问题的地方。
【在 d**d 的大作中提到】
: 面试的时间被问到的,感觉当时答的不太好,上来请教一下大家。
: 问题是这样的,
: 有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
: 是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
: 余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
: 有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
: 个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
: 传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
: 出了问题。
: 我当时的回答是这样的:
就是有问题的地方。
【在 d**d 的大作中提到】
: 面试的时间被问到的,感觉当时答的不太好,上来请教一下大家。
: 问题是这样的,
: 有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
: 是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
: 余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
: 有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
: 个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
: 传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
: 出了问题。
: 我当时的回答是这样的:
c*e
10 楼
就是面试的不想要你的,故意给你个难题。你知道他们面试老印的时候问的问题吗?就
是纯聊天!
【在 d**d 的大作中提到】
: 面试的时间被问到的,感觉当时答的不太好,上来请教一下大家。
: 问题是这样的,
: 有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
: 是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
: 余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
: 有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
: 个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
: 传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
: 出了问题。
: 我当时的回答是这样的:
是纯聊天!
【在 d**d 的大作中提到】
: 面试的时间被问到的,感觉当时答的不太好,上来请教一下大家。
: 问题是这样的,
: 有一堆数据,几十万行的数据,每行就是三个变量,时间,变量1和变量2。三个数据都
: 是从现场的传感器上采集的。在正常的情况下,变量1和变量2是按照某种曲线(假设是
: 余弦曲线)来对应的,但是都是独立采集的。由于采集变量2的传感器的精度有限,所
: 有变量1的变化不能一一的表现在变量2 的数值变化上,变量1每变化256,变量2能有一
: 个数值的变化。问题是: 现在已经能够知道在给你的这几十万行的数据,采集变量1的
: 传感器在某些时间出了问题,你怎样写一个程序来分析这些数据,找出在那些时间点上
: 出了问题。
: 我当时的回答是这样的:
g*t
11 楼
很明显这是EE的题。这里都是CS的。
变量1和2分别就是电压和电流。
你需要算他们之间的传递函数。吹的悬一点
就是什么kalman filtering,维诺卷积等经典算法。
说的土一点就是把电压和电流分别作傅立叶变换,
然后V(jw)/I(jw) fitting算出来传递函数,以及误差区间。
在3*sigma以外的点就是有问题的点。
你可能不适合这个工作。线性系统理论这方面基础得一年甚至几年
才行。本科的工程数学至少要学复变函数,积分变换两门课。但这些东西
学了也没什么大用。不如学个java.
如果连传递函数四个字都不知道,去
处理传感器的信号是没有意义的。
变量1和2分别就是电压和电流。
你需要算他们之间的传递函数。吹的悬一点
就是什么kalman filtering,维诺卷积等经典算法。
说的土一点就是把电压和电流分别作傅立叶变换,
然后V(jw)/I(jw) fitting算出来传递函数,以及误差区间。
在3*sigma以外的点就是有问题的点。
你可能不适合这个工作。线性系统理论这方面基础得一年甚至几年
才行。本科的工程数学至少要学复变函数,积分变换两门课。但这些东西
学了也没什么大用。不如学个java.
如果连传递函数四个字都不知道,去
处理传感器的信号是没有意义的。
c*e
12 楼
这个case是ee的问题,但是学ee的又写不出java的程序。这就是这个问题的困难的所在
。需要一个ee的,一个cs的,2个人同时来处理这个问题。招人的可能为了省钱,想让1
个人做2个人的事。
【在 g****t 的大作中提到】
: 很明显这是EE的题。这里都是CS的。
: 变量1和2分别就是电压和电流。
: 你需要算他们之间的传递函数。吹的悬一点
: 就是什么kalman filtering,维诺卷积等经典算法。
: 说的土一点就是把电压和电流分别作傅立叶变换,
: 然后V(jw)/I(jw) fitting算出来传递函数,以及误差区间。
: 在3*sigma以外的点就是有问题的点。
: 你可能不适合这个工作。线性系统理论这方面基础得一年甚至几年
: 才行。本科的工程数学至少要学复变函数,积分变换两门课。但这些东西
: 学了也没什么大用。不如学个java.
。需要一个ee的,一个cs的,2个人同时来处理这个问题。招人的可能为了省钱,想让1
个人做2个人的事。
【在 g****t 的大作中提到】
: 很明显这是EE的题。这里都是CS的。
: 变量1和2分别就是电压和电流。
: 你需要算他们之间的传递函数。吹的悬一点
: 就是什么kalman filtering,维诺卷积等经典算法。
: 说的土一点就是把电压和电流分别作傅立叶变换,
: 然后V(jw)/I(jw) fitting算出来传递函数,以及误差区间。
: 在3*sigma以外的点就是有问题的点。
: 你可能不适合这个工作。线性系统理论这方面基础得一年甚至几年
: 才行。本科的工程数学至少要学复变函数,积分变换两门课。但这些东西
: 学了也没什么大用。不如学个java.
相关阅读
mitbbs 包子监控机的设计设想及专利声明 (转载)PrologHow to kill a window without title?C#和C++的reference有什么不同?如何控制输出的颜色?PHP语法一问问一道C++的题目。 (转载)question on TCP slow start问一个关于ANSI C中system命令的问题is this behavior undefined?Help -- How to output error messages to a file for scripts called by system calls???问一道排序题目data structure 课的 Mappings 翻译成中文是什么?how to write C++ under Unix/Linuxn*(n-1)*(n+1)/3 re:一个数据结构中的数学求和问题求教 (转载)is it possible to design a zero miss rate cache?Top 100 H1B Visa Sponsors in IT一道c++ 题, 找出duplicate numbers能有人详细讲一下这两道google的面试题吗?这个技术为什么没人用