做顶尖咨询公司的数据科学家有多酷?我的三个月零基础转行经历
数据科学行业由于其跨领域、交叉学科等特点,源源不断地吸引着各行各业的同学们转行加入。而咨询行业凭着其本身的悠久历史和精英光环,从来也不缺各式各样的求职者竞相争取。
那么大家一定想知道,在顶尖咨询公司做数据科学家是多酷的体验?
我们请来了Lin Chen学长在为大家带来了自己的求职时间线,面试经验分享,以及数据岗位备考的干货。
Lin Chen
化学专业,从毕业到工作都是从事化学方面的工作,没有任何data背景。去年年初决定转行,五月参加了Techie的数据科学集训营,八月拿到了Accenture offer,九月入职。
讲座在5月15日已经结束,应大家要求,小编特地整理了文字版的详细梳理,大家也可以在Techie科技求职Youtube主页上观看剪辑精华版。
01
转行动机 & 前期准备
有一部分是私人原因,我现在在西雅图,没有什么化学方面的工作职位,所以有了这个念头。主观原因还是因为我自己对data感兴趣,喜欢挖掘数据分析数据。挑战主要是在我几乎没有coding背景,并且我是做化学实验的,也不像理论或者化学工程可能会积累一些相关知识。这些都是我需要短时间弥补的弱点。
现在在网上自学data science的方式很多,但如果短时间内跳槽的话,Techie的优势非常明显:更加有面试导向性。不仅是帮我们系统梳理知识,而是更会告诉我们对于某个知识点,具体面试可能会怎么问,follow up可能会怎么问,等等。押题非常准。
举个简单的例子:有个关于ABtesting的知识点,在Techie的课上就有一张表格总结了当sample size大和小的时候,population variance知道或者不知道的时候,都分别怎么去做AB test。后来我上完课没多久就遇到了一个面试的第二轮,刚好就和这个有关。我就结合了课上的summary把这个问题回答了出来,让面试官非常满意。
►►►
汪淼老师补充
现在我们遇到各种各样的同学从各个行业转data或者SDE,尤其是有些同学之前的工作和coding或者tech都没有什么太大关系,他们会觉得在转行方面的起步更难。这个时候一定要结合自己的兴趣和passion去做选择。Techie也提供SDE相关的培训,所以并不是鼓励每个人都无脑转data。data只是一个工具,本身并不产生价值,只有和具体行业和领域结合起来才能发挥翻倍的价值。
02
面试规划 & 备考安排
关于data方面的面试备考,大家能做的事情大体都差不多,不过有几点我觉得非常重要:
第一,根据自己的逻辑和习惯,把老师说过的东西做个梳理和总结。比如说Random Forest的优缺点是什么,原理是什么。Deep Learning的优缺点是什么,等等。
第二,由于面试官问问题都是随机的,这要求你对知识点的掌握非常熟练。需要在高压的环境下做出最好的表现。我当时的做法是把所有知识点都打印出来,让家属随便挑问题考我。虽然我以为自己已经倒背如流了,却在真正回答问题的时候磕磕巴巴。并且家属在问我问题的时候可能会好奇追问我一下,这就是很常见的面经问题:用最简单朴实的语言介绍一个专业术语或者概念,比如说p-value。这个过程可以帮助我们更透彻地理解问题。
最后,你在面试的过程中可以将所有的题目都列个文件存进去。这样当你收集了足够面试问题之后,你就有个更清晰的框架知道自己应该掌握什么知识,有哪些地方是欠缺的。有时你也不知道面试的正确答案是什么,可能面试官也不知道,这个时候Techie的面经论坛就是一个很好的资源分享平台,大家可以上去看看别人讨论的内容,也可以分享自己的看法。
►►►
汪淼老师补充
对于基础知识,我们应该对building block非常熟悉,然后和不同的人交流,最好是对这个领域不太了解的人。因为对你的领域不了解的人在提问的时候,最想知道就是为什么你的解决方法make sense。如果你说出的话和非从业人员没有区别,不能自圆其说,自然难以qualify面试。
03
面试流程 & 心得体会
数据科学岗位的面试流程大家都有所了解。先是HR联系,然后HM联系,不会太techinical,主要问你背景和项目经验,判断你对业务是否熟悉,是不是他们要找的人。然后会有一个组员来面试你的technical。我遇到过的面试有两种,第一种是自己有个问题清单,一道一道问你,比如说gradient descent是什么,reinforment learning是什么, 等等。还有一种情况是根据你的简历,深入地问你项目细节,并且follow up,等等。
关于OA,Accenture没有给我OA,但是我也做过别的公司的OA,这个我个人觉得是最难练习也是最难控制和准备的。因为你不知道给你的data长什么样,也不知道公司想要考察你的点是什么,没有什么标准答案,可能他们也不一定在看你答案对不对,而是看你分析的是否合理,结论是否make sense。
►►►
汪淼老师补充
OA确实是一个比较难捉摸的点,做OA首先仍旧需要基础building blocks,比如说python,pandas,visualization等等。第二就是需要灵活运用起来。比如说需要找一些数据中的坑,提出一些错误的解决方案等等,提一些新的idea。
练习OA最重要的就是去实战做一些项目。Techie给大家编了两个项目,基本上能让大家把可能遇到的坑都遇到了。Techie网站上最近也发布了一篇文章是关于OA的总结。大家可以作为参考。
最后就是onsite,会让你做presentation。一般能让你进到这一轮的话,你的technical和OA都应该不会有什么大的问题,至于onsite会问你更多techinical还是bq,则是因人&公司而异,咨询公司更喜欢问behavioral questions,以及如何平衡团队和客户需求等等。
04
Q&A时间
✓
Q1
请问Lin同学是否面试过其他类型的公司?咨询和非咨询的数据科学面试的区别是怎样的?工作内容的区别又是怎样的?
我确实面试过一些其他公司,科技公司,retail公司等等。就Data Scientist而言,technical方面的区别并不是很大。区别可能是BQ,毕竟作为consultant,面向客户,肯定和in house的数据科学家不一样,你要确定你的是否适合这个工作。
我们作为咨询公司的DS的日常也是一直和数据打交道,包括要和客户沟通,把技术和知识转移给客户。很多时候客户自己也不清楚自己的需求,这个时候你作为咨询师你就需要引导客户把问题提明白。问题提明白了,那么问题也就解决了大半了。
✓
Q2
咨询公司DS对coding的要求,比如说binary search,算法相关的问题会遇到多少?
DS的coding面试有两种:一种是和日常工作联系非常紧密的,比如说sql和python如何转换,还有就是字符串的处理,也就是data preposseing。比如说有些logs有很多空格,需要进行匹配。另一方面就是数据结构和算法相关,和SDE很相似。关于这部分的备考,我也建议同学从基础做起。从Leetcode的easy或者大公司的medium开始。
Techie网站上也有coding相关的内容的免费文章,包括youtube上也有史强老师给大家说了五段关于binary search相关的内容,希望可以给大家带来帮助。
✓
Q3
基础薄弱的同学该如何准备简历和项目?
项目最好和简历相关,如果你不是PHD,简历最好不要超过一页。如果是没有工作经验,写3-4个项目,如果有工作经验,写一两个工作经验,再写一两个项目就可以了。
项目一定要是hot topic,一定是大家都可能会用的。因为你一定会投很多简历,你的项目最好就比较general,比如说任何互联网公司可能会有商品推荐(recommendation system)、user targeting。或者NLP对应customer service,AI chatbox。或者有些fraud detection,等等。要是你现在没有项目的话,尽量往这些领域去挑选项目,这样投资回报会高一些。不需要写太多个项目,而是把一个项目写的细致一点。
✓
Q4
Data Scientist和Machine Learning Engineer的区别是什么?Applied Scientist算是MLE还是DS?
Techie的文章上也有相关介绍,MLE并不是SDE+DS那么夸张,只是对coding的要求会高一些,涉及到数据结构和算法。在system design方面,MLE的会和机器学习的结合更紧密,对ABtesting这类统计的考察会少一些。 举个例子,比如recommendation 模型速度慢该怎么办?解决方案就涉及到system engineering比如caching,也有modeling的优化相关。
至于Applied Scientist,需要看公司。Amazon这样的公司的Applied Scientist和MLE没什么区别,而有的公司的相关职位,比如说某些搜索引擎公司,则非常偏向统计,四轮都面ABtest。所以建议同学要从面经和job description去了解这个职位做什么,不能只看title。
Techie近期开班课程火热报名中:
(点击图片链接查看课程详情)
欢迎扫描Techie教师团队微信,获取最新面试备考信息和专业辅导。
Techie,有温度的科技职业发展平台。
点击下方“阅读原文”进入Techie论坛,获取更多科技求职面试干货资料!
微信扫码关注该文公众号作者