Redian新闻
>
现在面对data science或programming的找工作和竞赛做题网站是泥沙俱下啊
avatar
现在面对data science或programming的找工作和竞赛做题网站是泥沙俱下啊# DataSciences - 数据科学
c*e
1
价值,交换价值,使用价值有几重了?马克思讲价值与交换价值的关系的时候,价
值的概念实际是使用价值的内容,他讲价值与使用价值的关系的时候,价值的概念实际
是交换价值的内容,完全是混乱不堪东西却把你骗的团团转,这是彻头彻尾的文字陷阱
,使用价值和交换价值都是价值加上个限定词造出来的,所以价值是大类,使用价值和
交换价值是其从属,就这么简单的关系,价值是不能独立于使用价值和交换价值的,因
为之间有交叉,你提到价值的时候实际上也提到了这二者,也算是同义的反复,与其说
商品二重性是价值与使用价值,不如说是交换价值与使用价值,但交换价值就是价格,
使用价值就是你觉得物品的哪些属性好,好到什么程度,是人的评价。价格是客观,评
价是主观,按照人的主观能动性来说,二者应该是因果关系,有先后之别,不是什么二
重性的同时存在。马克思这样左拼右突的原因是什么?他是为了在交换价值和使用价值
之外为劳动开辟一个做商品价值定义的空间,如果原本真的有这样的空间,商品的价值
可以包含劳动、使用价值、交换价值,他需要这么卖力吗?商品价格即使决定于劳动,
也不能证明商品价格与商品价值有必然联系,价值即使是劳动凝结的,由整体与部分的
关系上来说,整体也不等于是部分,这就是问题的所在,他得另辟奇径,不如直接规定
价值就是劳动,剩下的那一点点缝隙只好留给信众去脑补:劳动部分如何组成价值整体
的规划蓝图还没有找到,这是人群中稀有的智慧。美其名曰,脑力劳动或者复杂劳动,
意思是一般人的劳动中本来就包含的有,只是每个人的分工不同,不用去找,事实却恰
恰相反,以社会平均智力水平为根本目标的激励机制压制了整个社会的发展空间。我至
始而终说,马克思不是个科学家,而是操弄观念的高手,富有争议、定义不明的价值概
念是他的道具。
avatar
d*c
2
发现现在有很多网站,从各个角度入手在找工作的市场中赚钱,就以data science和
programming方面为例,列举几个看到的网站和现象。自己只是初学者,观察的不准确
的地方或者说错的地方欢迎指正
kaggle算是做的比较有影响的,通过competition拿奖金或者公司招人,似乎之前还有
几个公司的compeition,现在比较少了,要么是学术性的会议competition放到kaggle
平台,要么是某些教育性的练习,还有的是某些公司自己遇到的问题,可是感觉提供的
数据信息太少,它可能是怕泄露机密,但就给一堆没名字的feature然后去预测click
through真的可以?如果比较简单能做出来,也不用贴出来悬赏了吧?
有些competition的leader成绩很好,进去一看是deep learning的phd们,感觉是专业
队员到业余俱乐部炫耀一下顺便做个广告的。还有不少参加者就是machine learning的
phd在读学生。
有一类网站是作为contractor中介,注册你的专业特长和hourly rate,公司悬赏项目
,大家竞标,网站抽成。进去一看,几个什么大学的副教授之类的在上面注册了竞标。
还有个网站是类似于topcoder,叫hackrank,去做题攒积分,不过不仅包括算法题,还
包括了machine learning方面。里面一大堆印度人,网站有印度的office。做了几个R
的题,然后有道题是给几天股票数据预测下一天的,觉得做这个毫无意义。
另外它可能是为了快糙猛地支持多种语言,解题的时候必须自己处理stdin stout,感
觉如果问题简单的话一大半功夫都花在这上面了。leetcode的online judge做的好用的
多,只是写个函数,然后它用unit test的形式测试,出错的话告诉你在哪个test case
出错,很有帮助,而这个hack rank,你可以下载test case,不过要花某种积分(不是
做题的积分)。
最后提一个网站,teamleada,貌似是几个学生采访了几个业界人士出了本书,然后开
公司做网站,开始是声称提供training,我去做了,做到一个A/B test的时候到后来怎
么都觉得不对劲,发信问是不是题目有问题,结果不正面回答,说网站改版了,现在做
那个题要交$99注册course。前后这网站改版几次了,现在好像不注册还看不见课程价
格了,一副要排队的样子,网站ceo之前没回答题目问题,几天后发信说你好像排队注
册课程了,欢迎交钱上课,我问他那问题解决没有,然后没下文了。
之前本来想写个blog讨论遇到的问题的,它改成收费课程,也不敢具体讨论了。不过应
该可以定性说一下。
某公司的call center接客户电话订票,call log数据包括客户的打电话时间,caller
id提供的电话号码,一部分人提供了名字,地址,email。第一个dataset是打电话但没
有预定的,所以很多人只有一个last name和caller id,其他什么都没有。对这些人分
两组,test组投送广告,control组不投送作为对照组,然后有一个打电话并且订票的
data set,需要找出有多少人是已经在第一个dataset中打过电话没订票,然后第二次
再打订票了,其中多少是test组多少是control组然后算conversion rate,衡量广告效
果。因为第二个data set的人都订票了,所以数据全一些,大部分有名字和地址,
email。
那么如何找到在两个数据集都出现的人?按名字match不行,按email有不少重复,按
caller id有不少重复,许多人用同一个电话号码打入,但有不同的名字,地址,相似
但不同的email,也许是同一个公司的由同一个小蜜下的单。
我说的觉得题目有问题还不是这个match问题,而是题目里两个data set里每个记录都
有test/control标记,那么首先这个公司怎么给第一次打电话的人发广告?这里如果有
其他手段track或记录的话,其实不需要后来用其他方法去找同一个人。先不提这一点
,第二个数据集的所有人都是在第一个数据集里打过电话的人吗?从常理来看应该没有
这个假设,但是题目的test control描述暗示了如此,两个数据集所有record都有test
control标记,而且第二个里面的test member数量是第一个的test member的三倍。这
和题目里描述的专门针对第一个数据集里的客户投放广告实际是矛盾的。
这个公司的课程,你敢交钱上吗?
avatar
h*7
3
Kaggle奖金太少,NM AUC小数点后三位分胜负实在太扯了。大点的项目一个人业余搞根
本拼不过专门的学生屌丝团队 还不如专注工作
以前Google举行过周赛算法比赛,全C++拼速度拼脑筋,那才刺激,也赚。国内都是几
个学校的ACM队员去捞外快,不过那时候人民币是8:1美元,国内物价也低

kaggle

【在 d******c 的大作中提到】
: 发现现在有很多网站,从各个角度入手在找工作的市场中赚钱,就以data science和
: programming方面为例,列举几个看到的网站和现象。自己只是初学者,观察的不准确
: 的地方或者说错的地方欢迎指正
: kaggle算是做的比较有影响的,通过competition拿奖金或者公司招人,似乎之前还有
: 几个公司的compeition,现在比较少了,要么是学术性的会议competition放到kaggle
: 平台,要么是某些教育性的练习,还有的是某些公司自己遇到的问题,可是感觉提供的
: 数据信息太少,它可能是怕泄露机密,但就给一堆没名字的feature然后去预测click
: through真的可以?如果比较简单能做出来,也不用贴出来悬赏了吧?
: 有些competition的leader成绩很好,进去一看是deep learning的phd们,感觉是专业
: 队员到业余俱乐部炫耀一下顺便做个广告的。还有不少参加者就是machine learning的

avatar
d*c
4
刷leetcode题的时候找到一个国内的blog,大部分题都做的比常见的解法更好,但有的
地方有点过于追求代码短了,还有很多一般人不熟悉的小技巧,感觉就是ACM之类算法
竞赛训练出来的。刷题刷到后来,感觉面试怎么变成ACM竞赛了...
顺便介绍给刷题的人参考
http://blog.csdn.net/linhuanmars

【在 h*****7 的大作中提到】
: Kaggle奖金太少,NM AUC小数点后三位分胜负实在太扯了。大点的项目一个人业余搞根
: 本拼不过专门的学生屌丝团队 还不如专注工作
: 以前Google举行过周赛算法比赛,全C++拼速度拼脑筋,那才刺激,也赚。国内都是几
: 个学校的ACM队员去捞外快,不过那时候人民币是8:1美元,国内物价也低
:
: kaggle

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。