s*s
2 楼
我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
不快。
我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
test group里的人找一个最相近的control。我的想法是这样的:
两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
squares of the differences in those variables between the test and control)
, 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
不快。
我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
test group里的人找一个最相近的control。我的想法是这样的:
两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
squares of the differences in those variables between the test and control)
, 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
j*n
4 楼
yes, SQL is good for doing the job you said.be sure to have proper indexes
if your sample is large.
remember do not use cursor.
if your sample is large.
remember do not use cursor.
f*g
5 楼
最近好像又说不退休了,会再监制一部~~不知道是不是真的。期待新片哈哈~~~
j*y
6 楼
算法很简单
速度看你样本多大
2个表cross join后可能会很大
不知道有啥方法优化
【在 s****s 的大作中提到】
: 我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
: 他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
: 不快。
: 我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
: test group里的人找一个最相近的control。我的想法是这样的:
: 两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
: test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
: squares of the differences in those variables between the test and control)
: , 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
: 好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
速度看你样本多大
2个表cross join后可能会很大
不知道有啥方法优化
【在 s****s 的大作中提到】
: 我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
: 他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
: 不快。
: 我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
: test group里的人找一个最相近的control。我的想法是这样的:
: 两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
: test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
: squares of the differences in those variables between the test and control)
: , 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
: 好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
M*h
7 楼
他怎么老是最后一部啊~~~不过很高兴哈
B*g
8 楼
全公司就你一个人会还不抓紧,搞好了就是小头了,至少也是技术骨干
【在 s****s 的大作中提到】
: 我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
: 他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
: 不快。
: 我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
: test group里的人找一个最相近的control。我的想法是这样的:
: 两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
: test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
: squares of the differences in those variables between the test and control)
: , 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
: 好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
【在 s****s 的大作中提到】
: 我是我们全公司唯一懂一点儿SQL的了, 我们老板总试图让我用SQL去做一些分析,
: 他认为SQL比我们用的统计软件快。 可是我不知道怎么做, 而且也不确定用到底快
: 不快。
: 我们要做的是有一个test group, 另外有一个control group, 我们想给每一个在
: test group里的人找一个最相近的control。我的想法是这样的:
: 两组数据里的变量都一样, 比如年龄(), 身高, 体重。 首先 ,对每一个
: test group里的人, 计算每一个在control group里的人与他的距离(就是 sum of
: squares of the differences in those variables between the test and control)
: , 然后找出距离最小的那个就是他的control。 大家说这种计算用SQL快吗? 有更
: 好的方法吗? 如果不适合用SQL, 我要怎么convince老板阿?
相关阅读
IBM DB2 Viper 来势汹汹SQL server 是不是free的?怎样快速得到两个表的交集Data warehouse textbookDatabase 版空文章已被系统自动清除如何用MFC连接search engine?请教一个JDBC的问题 getTableName()急问一个奇怪的sql server数据库问题有谁给讲讲Database和xml import/exportM$ Delivers SQL Server PreviewA SQL question新手求救:如何给我sort完的表填加一列自然数显示order?软件开发求助 MySQL Quietly Drops Support For Debian Linux(ZZ) (转载)FYI: free SQL 2005 e-learning courses急问 hibernate query数据据库的老版本的性能问题?MySQL起不来了。问个SQL的问题== MySql问题 ==