Redian新闻
>
Re: 攒人品,发Google Statistician/Data Scientist电面面经
avatar
Re: 攒人品,发Google Statistician/Data Scientist电面面经# DataSciences - 数据科学
m*t
1
【 以下文字转载自 Statistics 讨论区 】
发信人: management (management), 信区: Statistics
标 题: Re: 攒人品,发Google Statistician/Data Scientist电面面经
发信站: BBS 未名空间站 (Tue Sep 30 19:56:20 2014, 美东)
regression 怎么check model是啥意思
log reg跟其他的classification最大的不同还是他有概率结果吧
t-test问了大概什么问题
numerical跟categorical怎么表示真的不知道 这算data visualization吧
但是numerical化01 最简单的方式是bucketization吧
除此之外 还有什么方法?
已经悲剧了,为接下来找工作攒人品吧,希望快快有offer。
recruiter强调说让复习以前学的基础知识,probability,t test和regression之类的
。也听人说G家统计方向的职位都是问很基础的统计知识,但是我被问了time series的
东西,都有哪些models,怎么比较这些models?还问了experimental design的问题,
如果variables有numerical和categorical的,怎么在X和Y轴表示出来。还有logistic
regression的题目,怎么check model,logistic regression和其他的classification
methods有何不同。
avatar
m*a
2
好难啊~~

【在 m********t 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: management (management), 信区: Statistics
: 标 题: Re: 攒人品,发Google Statistician/Data Scientist电面面经
: 发信站: BBS 未名空间站 (Tue Sep 30 19:56:20 2014, 美东)
: regression 怎么check model是啥意思
: log reg跟其他的classification最大的不同还是他有概率结果吧
: t-test问了大概什么问题
: numerical跟categorical怎么表示真的不知道 这算data visualization吧
: 但是numerical化01 最简单的方式是bucketization吧
: 除此之外 还有什么方法?

avatar
m*a
3
曾经看过Google Analytics的一篇文章,感觉 Google 的分析应该是赶不微软,跟
Yahoo 比就差得更远了。看看这几个问题,只能说是确认了之前的感觉。
regression 怎么 check model, 其实很简单,那些学统计学得将成未成的死脑筋们就
记得个看R-square, 那些统计学成了的和不是统计出身的Data Scientist大概看一下
Prediction 对 Actual 的散点图就够了

【在 m********t 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: management (management), 信区: Statistics
: 标 题: Re: 攒人品,发Google Statistician/Data Scientist电面面经
: 发信站: BBS 未名空间站 (Tue Sep 30 19:56:20 2014, 美东)
: regression 怎么check model是啥意思
: log reg跟其他的classification最大的不同还是他有概率结果吧
: t-test问了大概什么问题
: numerical跟categorical怎么表示真的不知道 这算data visualization吧
: 但是numerical化01 最简单的方式是bucketization吧
: 除此之外 还有什么方法?

avatar
c*z
4
exactly :)

【在 m******a 的大作中提到】
: 曾经看过Google Analytics的一篇文章,感觉 Google 的分析应该是赶不微软,跟
: Yahoo 比就差得更远了。看看这几个问题,只能说是确认了之前的感觉。
: regression 怎么 check model, 其实很简单,那些学统计学得将成未成的死脑筋们就
: 记得个看R-square, 那些统计学成了的和不是统计出身的Data Scientist大概看一下
: Prediction 对 Actual 的散点图就够了

avatar
P*6
5
check model, 为什么不可以是cross validation?

【在 m******a 的大作中提到】
: 曾经看过Google Analytics的一篇文章,感觉 Google 的分析应该是赶不微软,跟
: Yahoo 比就差得更远了。看看这几个问题,只能说是确认了之前的感觉。
: regression 怎么 check model, 其实很简单,那些学统计学得将成未成的死脑筋们就
: 记得个看R-square, 那些统计学成了的和不是统计出身的Data Scientist大概看一下
: Prediction 对 Actual 的散点图就够了

avatar
j*4
6
cross validation不就是不断的prediction然后跟actual比较么

【在 P*****6 的大作中提到】
: check model, 为什么不可以是cross validation?
avatar
m*a
7
check model 应该是模型作出来后,先简单地看一下
1. 模型是否有问题 - 如某些地方预测得好, 某些地方预测得不好, 而预测得不好的地
方可能正是自己关心的, 要求保证精确的地方
2. 模型performance是否达到或接近期望的精度, 如果差的太远,可能就回去想别的办
法了
cross validation 应该是下一步的事, 模型没问题, 精度也符合预期, 这时就要考虑
模型的稳定性, 首先是对不同 Sample 的稳定性, 然后是对时间等等跨度的稳定
当然, 如果时间允许, 你也可以任何情况下都来一个cross validation, 但在公司里,
很少有人会让你这么干

【在 P*****6 的大作中提到】
: check model, 为什么不可以是cross validation?
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。