s*s
2 楼
我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
不快。
我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
test group里的人找一个最相近的control。我的想法是这样的:
两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
squares of the differences in those variables between the test and control)
, 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
不快。
我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
test group里的人找一个最相近的control。我的想法是这样的:
两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
squares of the differences in those variables between the test and control)
, 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
j*n
4 楼
yes, SQL is good for doing the job you said.be sure to have proper indexes
if your sample is large.
remember do not use cursor.
if your sample is large.
remember do not use cursor.
f*g
5 楼
最近好像又说不退休了,会再监制一部~~不知道是不是真的。期待新片哈哈~~~
j*y
6 楼
算法很简单
速度看你样本多大
2个表cross join后可能会很大
不知道有啥方法优化
【在 s****s 的大作中提到】![](/moin_static193/solenoid/img/up.png)
: 我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
: 他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
: 不快。
: 我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
: test group里的人找一个最相近的control。我的想法是这样的:
: 两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
: test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
: squares of the differences in those variables between the test and control)
: , 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
: 好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
速度看你样本多大
2个表cross join后可能会很大
不知道有啥方法优化
【在 s****s 的大作中提到】
![](/moin_static193/solenoid/img/up.png)
: 我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
: 他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
: 不快。
: 我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
: test group里的人找一个最相近的control。我的想法是这样的:
: 两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
: test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
: squares of the differences in those variables between the test and control)
: , 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
: 好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
M*h
7 楼
他怎么老是最后一部啊~~~不过很高兴哈
B*g
8 楼
全公司就你一个人会还不抓紧,搞好了就是小头了,至少也是技术骨干
【在 s****s 的大作中提到】![](/moin_static193/solenoid/img/up.png)
: 我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
: 他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
: 不快。
: 我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
: test group里的人找一个最相近的control。我的想法是这样的:
: 两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
: test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
: squares of the differences in those variables between the test and control)
: , 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
: 好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
【在 s****s 的大作中提到】
![](/moin_static193/solenoid/img/up.png)
: 我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
: 他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
: 不快。
: 我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
: test group里的人找一个最相近的control。我的想法是这样的:
: 两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
: test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
: squares of the differences in those variables between the test and control)
: , 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
: 好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
相关阅读
sql 比access好吗?Help on MS SQL codeSQL 怎样和empty string 做比较阿HelpExcel 中Surface chart的问题,谢谢了[转载] 用perl或者java访问数据库问个查询的问题哪位先进用过MYSQL里面的LOCK TABLEHow to improve performance of Database?请问这两个SQL QUERY有什么错?A question about normalization请问MYSQL JDBC如何获得插入记录的编号[Help] data modeling question[转载] Help on getting large data from Oracle[转载] question about SQL in Accesshow to hot back mysql?请问个从windows通过jdbc连server的问题Apache/MySQLOracle 10g 在linux平台上的改进请教用ACCESS做REPORT(TABLE & GRAPH)