Hadoop 和Python的数据分析包哪个更值得学习?# Programming - 葵花宝典a*22015-01-22 08:011 楼thank you points 只能换一些gift card而且还不是等比的换,算下来还不如freedom。
g*s2015-01-22 08:012 楼比如Acquisition Price是每股100快,公司发了100股当时相当于价值1w。现在卖的时候股票跌倒50块,也就是一共亏了100*(100-50)= 5k那明年报税我可以报最多3k的capital loss,后年再报剩下的2k。这样理解对么?
j*u2015-01-22 08:014 楼刚刚在apple网页上 live chat,问了一些ipad2购买的问题。1. 网络销售开始于1AM PST,03/11。2. 现在还不清楚apple prcessing要花多少时间,应该不太长。3. 免费shipping要花3-6 business days。看起来还是店里购买比较好
e*c2015-01-22 08:016 楼看你换什么了。攒够10000点换Staples,算下来能有4.5%freedom【在 a******2 的大作中提到】: thank you points 只能换一些gift card而且还不是等比的换,算下来还不如freedom: 。
F*u2015-01-22 08:017 楼看你今年有没有其他股票盈利 如果有先抵消这部分 还有剩才报loss【在 g*******s 的大作中提到】: 比如Acquisition Price是每股100快,公司发了100股当时相当于价值1w。: 现在卖的时候股票跌倒50块,也就是一共亏了100*(100-50)= 5k: 那明年报税我可以报最多3k的capital loss,后年再报剩下的2k。这样理解对么?
C*a2015-01-22 08:019 楼thanks【在 j**u 的大作中提到】: 刚刚在apple网页上 live chat,问了一些ipad2购买的问题。: 1. 网络销售开始于1AM PST,03/11。: 2. 现在还不清楚apple prcessing要花多少时间,应该不太长。: 3. 免费shipping要花3-6 business days。: 看起来还是店里购买比较好
w*g2015-01-22 08:0110 楼python。我就是搞hadoop/spark的,不骗你。【在 S*******C 的大作中提到】: 对于马工工作而言,Hadoop 和Python用于机器学习的数据分析包哪个更值得学习?
d*82015-01-22 08:0111 楼关卡了0APR结束了也不提醒一声害的我付了利息freedom【在 a******2 的大作中提到】: thank you points 只能换一些gift card而且还不是等比的换,算下来还不如freedom: 。
g*s2015-01-22 08:0112 楼那如果同时有其他long term和short term capital gain,那这些capital loss用来抵消哪一部分呢?比如我有三个账号, 100 long term gain, 50 long term loss,60 short term loss。那我可以抵税的是不是就是 60-(100-50) = 10的capital loss?【在 F*********u 的大作中提到】: 看你今年有没有其他股票盈利 如果有先抵消这部分 还有剩才报loss
T*x2015-01-22 08:0115 楼python用于机器学习的数据分析包不是要在hadoop上运行的吗?单独学行吗?【在 w***g 的大作中提到】: python。我就是搞hadoop/spark的,不骗你。
s*g2015-01-22 08:0116 楼你这个换算只对一部分人有效有些人有用的上的giftcard可以换 就能实现5%没有用的上的 换了staples去卖 也能实现4.5%你这个换算只适用于没有用的上的giftcard 并且懒得卖卡的人freedom【在 a******2 的大作中提到】: thank you points 只能换一些gift card而且还不是等比的换,算下来还不如freedom: 。
S*C2015-01-22 08:0118 楼上研究生课程时很多人都用python的数据分析包做project,他们没有用到hadoop啊怎么回事【在 T*******x 的大作中提到】: python用于机器学习的数据分析包不是要在hadoop上运行的吗?单独学行吗?
T*x2015-01-22 08:0121 楼我也不懂,等wdong大牛指导。【在 S*******C 的大作中提到】: 上研究生课程时很多人都用python的数据分析包做project,他们没有用到hadoop啊: 怎么回事
w*g2015-01-22 08:0123 楼下一个anaconda就全都有了, 先scipy,然后再上scikit-learn。不是说hadoop没用。Hadoop有两种用法。第一种是做数据清洗。海量的日志数据进来,用Hadoop做各种清洗变换,不涉及任何machine learning。一般清洗完了数据量会减少10-100倍,一般就到了单机可以搞定的范围了。第二种是真的机器学习。对于第二种用法来说,python是走,Hadoop是跑。两个都不会自然先要学走。【在 T*******x 的大作中提到】: python用于机器学习的数据分析包不是要在hadoop上运行的吗?单独学行吗?
z*i2015-01-22 08:0124 楼手摇的,就是在B&H买的,最便宜C41药水.【在 i***f 的大作中提到】: 挺好。机器洗?啥药水?: : ★ 发自iPhone App: ChineseWeb 8.7
a*e2015-01-22 08:0125 楼据说 Hadoop 快过气了【在 S*******C 的大作中提到】: 对于马工工作而言,Hadoop 和Python用于机器学习的数据分析包哪个更值得学习?
i*f2015-01-22 08:0126 楼手摇1L能冲几卷?感觉不划算啊。★ 发自iPhone App: ChineseWeb 8.7【在 z****i 的大作中提到】: 手摇的,就是在B&H买的,最便宜C41药水.
w*g2015-01-22 08:0127 楼hadoop的mapreduce已经过气了。但是HDFS, Yarn以及上面的各种东西像hive, spark之类的几年内不会过气。【在 a****e 的大作中提到】: 据说 Hadoop 快过气了
l*b2015-01-22 08:0129 楼单机python内存有时候会爆, 怎么整?【在 w***g 的大作中提到】: 下一个anaconda就全都有了, 先scipy,然后再上scikit-learn。: 不是说hadoop没用。Hadoop有两种用法。第一种是做数据清洗。海量的日志数据进来,: 用Hadoop做各种清洗变换,不涉及任何machine learning。一般清洗完了数据量会减少: 10-100倍,一般就到了单机可以搞定的范围了。第二种是真的机器学习。对于第二种用: 法来说,python是走,Hadoop是跑。两个都不会自然先要学走。
i*f2015-01-22 08:0130 楼一般来说店洗的药水温度啥的都精准,只会更好啊。★ 发自iPhone App: ChineseWeb 8.7【在 g****r 的大作中提到】: LZ 用的是Tetenal C-41 Press Kit 吧: 我也用的这个: 效果挺好的: 自己洗比一般店洗的效果好很多
w*g2015-01-22 08:0131 楼如果你的机器<32G内存的话就换机器。台式机至少配32G内存,服务器至少配64G。现在服务器标配怎么着也到100G了吧。别告诉我你用笔记本在跑。【在 l*******b 的大作中提到】: 单机python内存有时候会爆, 怎么整?
g*r2015-01-22 08:0132 楼药水新鲜程度我觉得影响挺大的我在local一家专门的照相馆洗负片,不同的批次偏差还是很大温度控制我觉得负片的要求没有那么严格,只要保持三分半的102F就可以了而且即使有偏差,在扫描阶段也很容易做修正现在我不同批次间同样的底片的结果很稳定【在 i***f 的大作中提到】: 一般来说店洗的药水温度啥的都精准,只会更好啊。: : ★ 发自iPhone App: ChineseWeb 8.7
T*x2015-01-22 08:0133 楼好,谢谢。能不能再多说两句为什么Python是走Hadoop是跑。【在 w***g 的大作中提到】: 下一个anaconda就全都有了, 先scipy,然后再上scikit-learn。: 不是说hadoop没用。Hadoop有两种用法。第一种是做数据清洗。海量的日志数据进来,: 用Hadoop做各种清洗变换,不涉及任何machine learning。一般清洗完了数据量会减少: 10-100倍,一般就到了单机可以搞定的范围了。第二种是真的机器学习。对于第二种用: 法来说,python是走,Hadoop是跑。两个都不会自然先要学走。
l*b2015-01-22 08:0135 楼嗯...看来内存只能省着点用了单机硬盘IO的瓶颈有什么解决方案呀,CPU好多core都闲着,硬盘数据load不上来【在 w***g 的大作中提到】: 如果你的机器<32G内存的话就换机器。: 台式机至少配32G内存,服务器至少配64G。现在服务器标配怎么着也到100G了吧。: 别告诉我你用笔记本在跑。
z*i2015-01-22 08:0136 楼温度我现在控制的还可以,温度在上下一两度都可以.我一般积攒16卷就冲一次,冲完,药就扔了.【在 i***f 的大作中提到】: 一般来说店洗的药水温度啥的都精准,只会更好啊。: : ★ 发自iPhone App: ChineseWeb 8.7
T*92015-01-22 08:0137 楼都不难吧,为什么不都学我们用emr-jobs【在 S*******C 的大作中提到】: 对于马工工作而言,Hadoop 和Python用于机器学习的数据分析包哪个更值得学习?
e*72015-01-22 08:0138 楼这个包,各种语言都差不多。关键你把后面的数学搞明白点。★ 发自iPhone App: ChineseWeb 8.2.2【在 S*******C 的大作中提到】: 对于马工工作而言,Hadoop 和Python用于机器学习的数据分析包哪个更值得学习?
w*g2015-01-22 08:0139 楼挂多个硬盘同时读。台式机的话应该可以挂6个吧。如果数据总量不大的话上SSD也有帮助。【在 l*******b 的大作中提到】: 嗯...看来内存只能省着点用了: 单机硬盘IO的瓶颈有什么解决方案呀,CPU好多core都闲着,硬盘数据load不上来
w*g2015-01-22 08:0140 楼Hadoop不光是数学的问题。要玩转需要很强的系统背景。不然出了问题不知道怎么debug。【在 e*******7 的大作中提到】: 这个包,各种语言都差不多。关键你把后面的数学搞明白点。: : ★ 发自iPhone App: ChineseWeb 8.2.2
d*i2015-01-22 08:0141 楼哈肚婆没有什么数学问题吧,你说的是Mahout吧,就算是Mahout,那一点点牵涉到的数学也是非常的简单的superficial的。【在 w***g 的大作中提到】: Hadoop不光是数学的问题。要玩转需要很强的系统背景。: 不然出了问题不知道怎么debug。
k*g2015-01-22 08:0143 楼走是初阶,跑是进阶。他的意思是先把 scikit-learn学了,然後按需要再考虑是否学hadoop machine learning algorithms。【在 T*******x 的大作中提到】: 好,谢谢。: 能不能再多说两句为什么Python是走Hadoop是跑。
w*g2015-01-22 08:0144 楼Hadoop因为规模大,各种现成的算法就少,如果要用就得自己实现。而且实现起来难度比单机更大,不但要数学知识,想要算得快还得有系统知识。现在主流是Spark,上面有不少ML算法。Mahout已经out了。【在 d****i 的大作中提到】: 哈肚婆没有什么数学问题吧,你说的是Mahout吧,就算是Mahout,那一点点牵涉到的数: 学也是非常的简单的superficial的。
T*x2015-01-22 08:0145 楼python, Scala, R这三个data science 语言包括工具,哪个最值得学?【在 k**********g 的大作中提到】: 就是前期处理和後期处理的分别。
w*g2015-01-22 08:0146 楼如果是统计的话就学R。如果是CS的话就学python。python底下那套玩熟了再上scala和spark。【在 T*******x 的大作中提到】: python, Scala, R: 这三个data science 语言包括工具,哪个最值得学?
B*g2015-01-22 08:0147 楼用mahout就别整hadoop了,人家自己都放弃了【在 d****i 的大作中提到】: 哈肚婆没有什么数学问题吧,你说的是Mahout吧,就算是Mahout,那一点点牵涉到的数: 学也是非常的简单的superficial的。
B*g2015-01-22 08:0149 楼亲,不会吧,mahout早就转spark了http://mahout.apache.org/【在 l*********s 的大作中提到】: news source?
d*i2015-01-22 08:0150 楼scala的这样那样的DSL太扯淡,要么老老实实用Java,对于程序员来说通俗易懂易维护,要么直接用数学语言LaTex实现那种数学家通晓的数学符号,对于搞数学的人来说亲近易懂。否则既不像程序语言,也不像数学家熟悉的语言,啥也不像太怪异了。【在 B*****g 的大作中提到】: 亲,不会吧,mahout早就转spark了: http://mahout.apache.org/
b*r2015-01-22 08:0151 楼强re【在 w***g 的大作中提到】: Hadoop因为规模大,各种现成的算法就少,如果要用就得自己实现。而且实现起来难度: 比单机更大,不但要数学知识,想要算得快还得有系统知识。: 现在主流是Spark,上面有不少ML算法。Mahout已经out了。
z*e2015-01-22 08:0152 楼主要是手底下鸟人不听话非要用各种装逼语言都用java写看不懂才怪这就是为啥java好它work别人看得懂这就是为啥其他语言不好丫不work很多人看不懂【在 w***g 的大作中提到】: Hadoop不光是数学的问题。要玩转需要很强的系统背景。: 不然出了问题不知道怎么debug。
z*e2015-01-22 08:0153 楼都不值得学把idea学懂剩下的语法到时候查就是了【在 T*******x 的大作中提到】: python, Scala, R: 这三个data science 语言包括工具,哪个最值得学?