Redian新闻
>
PCA 可以用在mixture of continuous 和categorical variables (转载)
avatar
PCA 可以用在mixture of continuous 和categorical variables (转载)# DataSciences - 数据科学
E*e
1
【 以下文字转载自 Statistics 讨论区 】
发信人: ExpressoLove (MoneyForNothing), 信区: Statistics
标 题: PCA 可以用在mixture of continuous 和categorical variables
发信站: BBS 未名空间站 (Sun May 17 18:03:19 2015, 美东)
据我了解, pca用在continous variables 比较合理。categorical one怎计算
covariance matrix啊?
avatar
E*e
2
没有人回答吗? machine learning 不是必学的内容吗?

【在 E**********e 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: ExpressoLove (MoneyForNothing), 信区: Statistics
: 标 题: PCA 可以用在mixture of continuous 和categorical variables
: 发信站: BBS 未名空间站 (Sun May 17 18:03:19 2015, 美东)
: 据我了解, pca用在continous variables 比较合理。categorical one怎计算
: covariance matrix啊?

avatar
s*a
3
categorical 是covariance 咯?是不是应该用anova?如果你又有continuous 也有
categorical的话在SAS下用GLM咯?
你PCA是用在MATLAB里的?
我也不是很懂。不对的话大家多多打击
avatar
E*g
4
我看如果categorical variable量化之后有意义的话,勉强也能用。

【在 E**********e 的大作中提到】
: 没有人回答吗? machine learning 不是必学的内容吗?
avatar
E*e
5
说到categorical variable, 一般已经是numerical categorical了(1,2,3,。。。
)。 textbook 好像很少讲到mixture的continuous 和 categorical variables。 事
实是很多时候modeling的时候, 都是mixture。 这种情况用pca来降维或者找出
significant的variabels是不是就有问题。
当然也许可以试correspendse analysis, 就是把continous variable group, 然后
用contigency table来找出关联。但是也很少说用了选significant variabels。
问这个问题是因为面试是碰到这个问题。 所以pca来选variables的话,好像不是那么
可信。 lasso也许是个更好方法。

【在 E*********g 的大作中提到】
: 我看如果categorical variable量化之后有意义的话,勉强也能用。
avatar
b*x
6
covariance is the solution of PCA, not the motivation of PCA
the motivation is a low-rank matrix factorization
when the approximation error is measured in squared errors we get back PCA
other approximation error can be used for categorical variables

【在 E**********e 的大作中提到】
: 说到categorical variable, 一般已经是numerical categorical了(1,2,3,。。。
: )。 textbook 好像很少讲到mixture的continuous 和 categorical variables。 事
: 实是很多时候modeling的时候, 都是mixture。 这种情况用pca来降维或者找出
: significant的variabels是不是就有问题。
: 当然也许可以试correspendse analysis, 就是把continous variable group, 然后
: 用contigency table来找出关联。但是也很少说用了选significant variabels。
: 问这个问题是因为面试是碰到这个问题。 所以pca来选variables的话,好像不是那么
: 可信。 lasso也许是个更好方法。

avatar
i*n
7
肯定可以用, 怎么定义difference between categorical variables,怎么interpret
results,要看具体问题了

【在 E**********e 的大作中提到】
: 说到categorical variable, 一般已经是numerical categorical了(1,2,3,。。。
: )。 textbook 好像很少讲到mixture的continuous 和 categorical variables。 事
: 实是很多时候modeling的时候, 都是mixture。 这种情况用pca来降维或者找出
: significant的variabels是不是就有问题。
: 当然也许可以试correspendse analysis, 就是把continous variable group, 然后
: 用contigency table来找出关联。但是也很少说用了选significant variabels。
: 问这个问题是因为面试是碰到这个问题。 所以pca来选variables的话,好像不是那么
: 可信。 lasso也许是个更好方法。

avatar
E*e
8
我的问题是用pca 来选signifiant variabales。 好像还没看到pca可以适合
categorial variables的。 昨天问了老师,答案也是negative, 倒是提了
correspondse analysis。 不过不是用来variables selections的。
比如一个binary variable(0,1), 难道可以用PCA来算它的variance的大小, 从而
确定看在total variance占的比例大小决定保留还是剔除。
我的一个想法是把categorial 和continouous 分开, 分开分析从而确定significant
varialbes

interpret

【在 i**********n 的大作中提到】
: 肯定可以用, 怎么定义difference between categorical variables,怎么interpret
: results,要看具体问题了

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。