晕乎~~~# Economics - 经济
w*i
1 楼
假期帮一个老师干活。
她们已经花了很长时间做了一篇paper,自己收集的数据,结果还不错。
现在想把数据扩充一下,把96到2000年的包括进来。让我帮忙给她们找数据。
我仔细看了列表(公司数据)很久,发现很多目标公司都无法identify,
比如名字只有一个Airtouch,
但数据库里有Airtouch Communications Inc, Airtouch Wireless等等,
都是跟她们要研究的相关的,但是选不同的公司数据显然不一样。
跟她们联系了一下,她们居然也没有完整名称列表。
后来我就说,那你们把老数据给我吧,我尽量让新老数据保持纪录一致。
(哦,还有一个问题,她们想从另外一个不同的database里找这些新数据)
拿到老数据之后,发现问题非常多。
比如有的是母公司数据,有的只是相关的子公司数据,
另外,这个过程中有很多公司进行了兼并或拆散,但是都没有做任何调整。
还有些很明显的数据不合理问题,比如一年之内雇员数加了好几个零等等。
在看另外一组统计数据时,也发现很多纪录的不一致性。
但是她们说这些数据都是以前雇人帮她们整理的,那些人已经毕业了。
(原始记录有好几箱子,我
她们已经花了很长时间做了一篇paper,自己收集的数据,结果还不错。
现在想把数据扩充一下,把96到2000年的包括进来。让我帮忙给她们找数据。
我仔细看了列表(公司数据)很久,发现很多目标公司都无法identify,
比如名字只有一个Airtouch,
但数据库里有Airtouch Communications Inc, Airtouch Wireless等等,
都是跟她们要研究的相关的,但是选不同的公司数据显然不一样。
跟她们联系了一下,她们居然也没有完整名称列表。
后来我就说,那你们把老数据给我吧,我尽量让新老数据保持纪录一致。
(哦,还有一个问题,她们想从另外一个不同的database里找这些新数据)
拿到老数据之后,发现问题非常多。
比如有的是母公司数据,有的只是相关的子公司数据,
另外,这个过程中有很多公司进行了兼并或拆散,但是都没有做任何调整。
还有些很明显的数据不合理问题,比如一年之内雇员数加了好几个零等等。
在看另外一组统计数据时,也发现很多纪录的不一致性。
但是她们说这些数据都是以前雇人帮她们整理的,那些人已经毕业了。
(原始记录有好几箱子,我