m*4
2 楼
本人CS硕, 最近在面开发的职位。前几天电面一家公司, 本来面后端开发的, 但是
聊的实验室项目, 他们挺感兴趣。
我们实验室是做识别的, 所以会用到很多classifier. 就聊聊ML的东西。 结果给我
发了个 data science challenge.
预测房价, 给了几万条training数据,有房价, feature 比如房屋类型, 地理位
置, 距离城里多远,有数字类型的, 也有categorical 的。
然后又有几万条数据同样类型的feature, 没房价,让建模型 预测。
要求一周内做出来,
提交代码。描述模型, 选的什么软件, 什么包
何种算法, 怎样选feature, 为什么
怎样分析模型的 accuracy , 用什么方法,为什么选这个方法
那个feature 影响高, 那个影响低, 用什么方法找的。
数据有错误, 要求清洗, 哪些清洗时必要的
---------------------------------
我们实验室就是用用 naive bayes, SVM 啥的。 没人真懂。
我觉得这是回归不是分类。 我上统计课的时候知道些线性回归的皮毛。
觉得此题对版上的人来说是小菜一碟, 特来讨教
聊的实验室项目, 他们挺感兴趣。
我们实验室是做识别的, 所以会用到很多classifier. 就聊聊ML的东西。 结果给我
发了个 data science challenge.
预测房价, 给了几万条training数据,有房价, feature 比如房屋类型, 地理位
置, 距离城里多远,有数字类型的, 也有categorical 的。
然后又有几万条数据同样类型的feature, 没房价,让建模型 预测。
要求一周内做出来,
提交代码。描述模型, 选的什么软件, 什么包
何种算法, 怎样选feature, 为什么
怎样分析模型的 accuracy , 用什么方法,为什么选这个方法
那个feature 影响高, 那个影响低, 用什么方法找的。
数据有错误, 要求清洗, 哪些清洗时必要的
---------------------------------
我们实验室就是用用 naive bayes, SVM 啥的。 没人真懂。
我觉得这是回归不是分类。 我上统计课的时候知道些线性回归的皮毛。
觉得此题对版上的人来说是小菜一碟, 特来讨教
b*y
3 楼
Shares of BP were up today after investors learned the company is
moving forward quickly with asset sales including a 7 billion dollar
deal to sell Apache’s upstream assest in the US and Canada. The
sales, all on land, reflect BP's desire to get more, involved in
deepwater drilling- regardless of the bad press following the
tragic oil spill in the Gulf of Mexico.
According to the charts, the technicals are starting to brighten up
for BP as well. On the daily chart, the MACD passed over the
“sign
moving forward quickly with asset sales including a 7 billion dollar
deal to sell Apache’s upstream assest in the US and Canada. The
sales, all on land, reflect BP's desire to get more, involved in
deepwater drilling- regardless of the bad press following the
tragic oil spill in the Gulf of Mexico.
According to the charts, the technicals are starting to brighten up
for BP as well. On the daily chart, the MACD passed over the
“sign
z*3
5 楼
svn regression, or maybe just linear regression
【在 m*******4 的大作中提到】
: 本人CS硕, 最近在面开发的职位。前几天电面一家公司, 本来面后端开发的, 但是
: 聊的实验室项目, 他们挺感兴趣。
: 我们实验室是做识别的, 所以会用到很多classifier. 就聊聊ML的东西。 结果给我
: 发了个 data science challenge.
: 预测房价, 给了几万条training数据,有房价, feature 比如房屋类型, 地理位
: 置, 距离城里多远,有数字类型的, 也有categorical 的。
: 然后又有几万条数据同样类型的feature, 没房价,让建模型 预测。
: 要求一周内做出来,
: 提交代码。描述模型, 选的什么软件, 什么包
: 何种算法, 怎样选feature, 为什么
【在 m*******4 的大作中提到】
: 本人CS硕, 最近在面开发的职位。前几天电面一家公司, 本来面后端开发的, 但是
: 聊的实验室项目, 他们挺感兴趣。
: 我们实验室是做识别的, 所以会用到很多classifier. 就聊聊ML的东西。 结果给我
: 发了个 data science challenge.
: 预测房价, 给了几万条training数据,有房价, feature 比如房屋类型, 地理位
: 置, 距离城里多远,有数字类型的, 也有categorical 的。
: 然后又有几万条数据同样类型的feature, 没房价,让建模型 预测。
: 要求一周内做出来,
: 提交代码。描述模型, 选的什么软件, 什么包
: 何种算法, 怎样选feature, 为什么
g*i
6 楼
嗬嗬,刚一个小护士,上午让我收4个kinect,172。中午看到涨到175了,就给我发信说
,被他老婆卖掉了。
咳,都是人对自己的定价啊。
,被他老婆卖掉了。
咳,都是人对自己的定价啊。
p*g
7 楼
If the feature number is huge, then it is a high-dimensional regression
problem after suitably dealing with the category data.
The questions are common in regression. You can easily find these answers (
principles, codes, etc) from a regression textbook and internet. But if you
know little about regression models, one week may be not enough.
problem after suitably dealing with the category data.
The questions are common in regression. You can easily find these answers (
principles, codes, etc) from a regression textbook and internet. But if you
know little about regression models, one week may be not enough.
p*r
9 楼
房价预测模型主要还是要靠feature engineering,做好不容易,楼主的基本知识和实
战经验可能一周
补不回来,我建议把基本的流程走一遍就好,比如随便挑个模型,做个regression,做
一下cross validation
然后用它的评价函数评价一下结果什么的。然后老实和人说自己不是建模专家但是有基
本功喜欢学习之类的
you
【在 p*******g 的大作中提到】
: If the feature number is huge, then it is a high-dimensional regression
: problem after suitably dealing with the category data.
: The questions are common in regression. You can easily find these answers (
: principles, codes, etc) from a regression textbook and internet. But if you
: know little about regression models, one week may be not enough.
战经验可能一周
补不回来,我建议把基本的流程走一遍就好,比如随便挑个模型,做个regression,做
一下cross validation
然后用它的评价函数评价一下结果什么的。然后老实和人说自己不是建模专家但是有基
本功喜欢学习之类的
you
【在 p*******g 的大作中提到】
: If the feature number is huge, then it is a high-dimensional regression
: problem after suitably dealing with the category data.
: The questions are common in regression. You can easily find these answers (
: principles, codes, etc) from a regression textbook and internet. But if you
: know little about regression models, one week may be not enough.
c*m
11 楼
用decision tree。random forest or boosting tree 这两个现在是最popular的了。
网上有现成的library。结果也好分析。
网上有现成的library。结果也好分析。
m*4
13 楼
建议regression和random forest都用一下,比较一下结果。random forest工业界用的
还是挺多的,结果一般也会比其他的model要好,不过解释性不强
【在 m*******4 的大作中提到】
: 本人CS硕, 最近在面开发的职位。前几天电面一家公司, 本来面后端开发的, 但是
: 聊的实验室项目, 他们挺感兴趣。
: 我们实验室是做识别的, 所以会用到很多classifier. 就聊聊ML的东西。 结果给我
: 发了个 data science challenge.
: 预测房价, 给了几万条training数据,有房价, feature 比如房屋类型, 地理位
: 置, 距离城里多远,有数字类型的, 也有categorical 的。
: 然后又有几万条数据同样类型的feature, 没房价,让建模型 预测。
: 要求一周内做出来,
: 提交代码。描述模型, 选的什么软件, 什么包
: 何种算法, 怎样选feature, 为什么
还是挺多的,结果一般也会比其他的model要好,不过解释性不强
【在 m*******4 的大作中提到】
: 本人CS硕, 最近在面开发的职位。前几天电面一家公司, 本来面后端开发的, 但是
: 聊的实验室项目, 他们挺感兴趣。
: 我们实验室是做识别的, 所以会用到很多classifier. 就聊聊ML的东西。 结果给我
: 发了个 data science challenge.
: 预测房价, 给了几万条training数据,有房价, feature 比如房屋类型, 地理位
: 置, 距离城里多远,有数字类型的, 也有categorical 的。
: 然后又有几万条数据同样类型的feature, 没房价,让建模型 预测。
: 要求一周内做出来,
: 提交代码。描述模型, 选的什么软件, 什么包
: 何种算法, 怎样选feature, 为什么
C*5
15 楼
Canonical correlation for both multi-linear regression and data mining? Or
decision tree or random forest or clustering?
decision tree or random forest or clustering?
F*l
16 楼
555
勤劳勇敢的小护士 162 卖了 15+ 个,今天刚给神医寄掉,应该早早学习一下,回头给
神医说:老婆今天刚卖掉了,把label给神医退回去~~~
我咋就这么命苦啊。。。
勤劳勇敢的小护士 162 卖了 15+ 个,今天刚给神医寄掉,应该早早学习一下,回头给
神医说:老婆今天刚卖掉了,把label给神医退回去~~~
我咋就这么命苦啊。。。
p*g
17 楼
搭车问,
如果遇到数据里, 数据里有的行,缺失 1,2 个feature,
不同的行, 可能缺失不同的feature, 怎么处理?
如果遇到数据里, 数据里有的行,缺失 1,2 个feature,
不同的行, 可能缺失不同的feature, 怎么处理?
z*3
22 楼
找我吧,说好的绝对不反悔。神医460求购4g bundle,我写信给神医说我要卖。过了2
分钟求购价就涨了10刀。虽然神医过了很久才给我回信,我还是460卖给神医。
分钟求购价就涨了10刀。虽然神医过了很久才给我回信,我还是460卖给神医。
m*u
41 楼
有个屁股好吵的,不是亏就是赚,都蛋定了把。
相关阅读
日,亏哭了BTFD: TCEHY JD MU一天一抄底如果现在这个时刻能判断正确的就是大牛!CAT卖了一支零售形势不妙啊明天就12月了今天的股市小结 (11/30)RYBNVDA今天继续跌呀企鹅暴跌啊花街这是在对议会加压,让他们知道后果设个BAC27.6的钓鱼跟2B练CME to launch bitcoin futures in three weeks after green light from regulator; bitcoin jumps比特币疯涨,什么股会受益这位焦油不错,在LA,单身板油可以试一试aws re-invent放了几个大招 可以仔细看看 赚钱还不靠他们看是大家终于有点惊慌了。时空穿梭下蛋鸡