a*0
1 楼
希望可以得到推荐
我读了两个硕士 一个是computer engineering 另一个是 statistics (学的是数理统
计和优化什么的 忘了不少了)
工作经历有 data mining 相关的projects (其实纯粹data mining的工作很少 大多数
是跟Natural language processing 相关的 data mining) 和NLP相关的projects 比
如 text summarization 比如topic modeling和 language models
对ETL还算熟悉
平时使用的工具是hadoop ecosystem 用的比较多的是
sqoop pig mapreduce hdfs hbase
其他非hadoop的工具用的比较多的是
weka lucene openNLP Nutch Mallet JDBC 等等
比较熟悉twitter的streaming API
平时也用server side的java 但是谈不上精通
java编程还可以 leetcode刷了两遍了
visualization用D3.js Gephi等 对前端的架构方面的知识不是特别了解 但是做个简
单的用于visualization的网站是可以的
我读了两个硕士 一个是computer engineering 另一个是 statistics (学的是数理统
计和优化什么的 忘了不少了)
工作经历有 data mining 相关的projects (其实纯粹data mining的工作很少 大多数
是跟Natural language processing 相关的 data mining) 和NLP相关的projects 比
如 text summarization 比如topic modeling和 language models
对ETL还算熟悉
平时使用的工具是hadoop ecosystem 用的比较多的是
sqoop pig mapreduce hdfs hbase
其他非hadoop的工具用的比较多的是
weka lucene openNLP Nutch Mallet JDBC 等等
比较熟悉twitter的streaming API
平时也用server side的java 但是谈不上精通
java编程还可以 leetcode刷了两遍了
visualization用D3.js Gephi等 对前端的架构方面的知识不是特别了解 但是做个简
单的用于visualization的网站是可以的