Redian新闻
>
有没有大牛来classifiy一下 PCA用法吗?
avatar
有没有大牛来classifiy一下 PCA用法吗?# DataSciences - 数据科学
c*9
1
有人说,80年代中日友好没人宣传日本作恶。。。
这算是经典谣言吧,南京大屠杀上历史课本叫"没人宣传"???
我更好奇的是,什么时候也把当时历史课本上美军在朝鲜战争对华细菌战,豫湘桂战役
,"抗战到底"中底是指"恢复到七七事变之前","溶共防共限共",皖南事变,解放战争
和抗战期间常凯申在国统区法西斯统治,解放后KMT对上海无差别轰炸再编回来。
还有当时课本没有的美国战后包庇纳粹战犯曼施坦因,731负责人石井中将,前侵华日
军总司令畑四六,老蒋丢弃外蒙,纵容英印侵略藏南,放弃西沙南沙编入课本。
这里面政治操作有没有?
avatar
E*e
2
紧接上面的一个帖子。 问这个问题,主要因为是interview是经常问到在regression
背景下,有1000多个variables, 应该怎么办。 面试官期待你回答PCA, lasso or 方
法。 univariate screeng 看起来不是他们关心的。 只要你回答出PCA,好像问题就OK
了。从来没有提出可不可以用到categorical variables上。 textbook 里用到的例子
好像都是continous variables。当然你跟我说PCA主要用了降维,那这个问题没好讨论
的。不知经常看到有人贴面经,谈到PCA选variables的。我也问统计系的教授, 回答
是negatvie。 不过提到correspondense analysis, 基于contigency table。 我了解
一下好像不能用来select significant variables。 谢谢。
欢迎大牛点评一下, 或者已经用过pca 在categorical 上的请留步。
avatar
h*d
4

OK

【在 E**********e 的大作中提到】
: 紧接上面的一个帖子。 问这个问题,主要因为是interview是经常问到在regression
: 背景下,有1000多个variables, 应该怎么办。 面试官期待你回答PCA, lasso or 方
: 法。 univariate screeng 看起来不是他们关心的。 只要你回答出PCA,好像问题就OK
: 了。从来没有提出可不可以用到categorical variables上。 textbook 里用到的例子
: 好像都是continous variables。当然你跟我说PCA主要用了降维,那这个问题没好讨论
: 的。不知经常看到有人贴面经,谈到PCA选variables的。我也问统计系的教授, 回答
: 是negatvie。 不过提到correspondense analysis, 基于contigency table。 我了解
: 一下好像不能用来select significant variables。 谢谢。
: 欢迎大牛点评一下, 或者已经用过pca 在categorical 上的请留步。

avatar
x*6
5
感觉纯numerical feature在实际应用里好少,在学校做项目的时候,几乎都是
numerical,就算是categorical的,每个categorial feature的value都比较少,转换
成0/1,也不会过于增大dimensionality。
我基本上在feature selection上,supervised的话,就用mutual information或者
information gain。
Unsupervised learning就有点不知道怎么办了。。。
avatar
a*g
6
你是要问pca 在categorical 上的应用?
avatar
E*e
7
紧接上面的一个帖子。 问这个问题,主要因为是interview是经常问到在regression
背景下,有1000多个variables, 应该怎么办。 面试官期待你回答PCA, lasso or 方
法。 univariate screeng 看起来不是他们关心的。 只要你回答出PCA,好像问题就OK
了。从来没有提出可不可以用到categorical variables上。 textbook 里用到的例子
好像都是continous variables。当然你跟我说PCA主要用了降维,那这个问题没好讨论
的。不知经常看到有人贴面经,谈到PCA选variables的。我也问统计系的教授, 回答
是negatvie。 不过提到correspondense analysis, 基于contigency table。 我了解
一下好像不能用来select significant variables。 谢谢。
欢迎大牛点评一下, 或者已经用过pca 在categorical 上的请留步。
avatar
x*6
9
感觉纯numerical feature在实际应用里好少,在学校做项目的时候,几乎都是
numerical,就算是categorical的,每个categorial feature的value都比较少,转换
成0/1,也不会过于增大dimensionality。
我基本上在feature selection上,supervised的话,就用mutual information或者
information gain。
Unsupervised learning就有点不知道怎么办了。。。
avatar
a*g
10
你是要问pca 在categorical 上的应用?
avatar
k*n
11
面试官并没有问你pca能不能用在categorical data上面,但是他说的pca方法用于选
variables是对的,因为pca的用途就是reduce dimension by reduce
multicollinearity variables,其实和stepwise variables selection一个道理
avatar
s*h
12
不是大牛。我说说我的看法
PCA categorical 肯定没法直接用。
我觉得说PCA选variables的面试官自己也不太清楚吧?
PCA已经改变了所有的变量,不能叫“选”变量了。
减少线性相关的feature是正确的。
传统统计如果重视解释性的话,PCA的结果不好用,虽然可以在某些情况下勉强给
feature定义,感觉并不是通用的方法。
此外可以用information value来选categorical variables
还有random forest。
avatar
l*8
14
直接上autoencoder啊。

OK

【在 E**********e 的大作中提到】
: 紧接上面的一个帖子。 问这个问题,主要因为是interview是经常问到在regression
: 背景下,有1000多个variables, 应该怎么办。 面试官期待你回答PCA, lasso or 方
: 法。 univariate screeng 看起来不是他们关心的。 只要你回答出PCA,好像问题就OK
: 了。从来没有提出可不可以用到categorical variables上。 textbook 里用到的例子
: 好像都是continous variables。当然你跟我说PCA主要用了降维,那这个问题没好讨论
: 的。不知经常看到有人贴面经,谈到PCA选variables的。我也问统计系的教授, 回答
: 是negatvie。 不过提到correspondense analysis, 基于contigency table。 我了解
: 一下好像不能用来select significant variables。 谢谢。
: 欢迎大牛点评一下, 或者已经用过pca 在categorical 上的请留步。

avatar
a*d
15
借道问一下,那么NMF相对于PCA有什么好处吗?我知道NMF系数都是非负,但是在实际
使用的时候到底用PCA还是NMF有没有什么经验?
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。