作为在全球ICT领域最具影响力的、最大的、全球领先的行业协会,CompTIA在其最新发布的《State of the Tech Workforce》中表示:Data Scientists&Data Analysts
果然,只要企业数字化一直在进行,对数据人才的需求就不会停止。
但与此同时,市场上还有另一种声音——
麦肯锡全球研究院的合伙人Anu Madgavkar表示:软件开发人员、网络开发人员、计算机程序员、编码员和数据科学家等技术岗位“很容易”被人工智能技术所取代。
关于“ChatGPT是否会取代DS&DA岗”这个问题,我们以DA岗位为例,直接咨询了ChatGPT本人,它的回答如下——通读下来,我们很容易得出一个结论:DA岗会不会被取代,取决于担任这个岗位的人是什么样的,如果他是一个——拥有更多技能和知识,包括统计学、数据可视化、数据清洗和处理、数据挖掘以及业务领域的专业知识;拥有与团队合作、理解业务需求、解释数据结果、独立思考、判断和决策等方面的能力的人,那么ChatGPT自然是无法取代他的。而上述的技能、知识和能力,正是当下科技巨头们在招人时所考察的内容,我们以一道面试题为例来具体分析一下——#直通硅谷show time#
没有人比大厂在职面试官更了解企业的招聘要求,想成为不可替代的求职候选人?扫码咨询课程详情!面试官:Company XYZ is an e-commerce site that sells hand-made clothes.You have to build a model that predicts whether a user has a high probability of using the site toperform some illegal activity or not. This is a super common task for data scientists.You only have information about the user first transaction on the site and based on that youhave to make your classification ("fraud/no fraud").These are the tasks you are asked to do:1)For each user, determine her country based on the numeric IP address.
2)Build a model to predict whether an activity is fraudulent or not. Explain how different assumptions about the cost of false positives vs false negatives would impact the model.
3)Your boss is a bit worried about using a model she doesn't understand for something as important as fraud detection. How would you explain her how the model is making the predictions? Not from a mathematical perspective (she couldn't care less about that), but from a user perspective. What kinds of users are more likely to be classified as at risk?What are their characteristics?
4)Let's say you now have this model which can be used live to predict in real time if an activity is fraudulent or not. From a product perspective, how would you use it? That is,what kind of different user experiences would you build based on the model output?
从这个case当中我们不难看出,Data面试中所考察的case和公司的业务场景结合的非常紧密,面试中比较难的考核点是Data Pipeline在case当中的应用。在这种情况下,如果你之前有做过跟business关联比较紧密的分析类型的项目,比如说偏向于marketing的广告数据的分析,偏向于用户的留存增长转化的machine learning的分析,ABtesting的应用等等。那么上述的case于你而言自然就不会陌生,回答起来也不至于找不到头绪。#还原真实面试现场#
还在用真实面试机会来试错?加入直通硅谷,专业导师用Mock带你复刻真实面试现场,高效备战!讲到这,道理大家应该都懂了,但翻了翻自己的过往经历,要不就是不具备商业属性——以环境工程专业为例,A同学经常会做气候方面的研究,平时确实接触了一些与数据分析相关的项目。但是这1、2个项目的结合非常有限,在简历呈现上存在局限性。
而互联网行业与学校的Research不同,非常注重是否与产品相结合、提升产品的商业能力,因此对应聘者项目中的商业属性(也就是我们常说的工业属性)非常重视。
A这样的简历虽然有数据分析经历,但他没有分析过诸如产品某一功能调整对用户和业务的影响,因此他与绝大多数科技公司的需求是不匹配的。以人工智能视觉项目为例,很多同学在学校中会完成一个用Python调取相关API完成一些网络图片的监测或者识别。那么问题来了:- 以应用场景对宠物进行识别为例,换到自然状态下获取的照片,受到自然光线的影响,算法鲁棒性是否依然存在?
- 结果的检测标准(KPI/Quality Matrix)是什么?
当仅仅用Python来调取相关方程,不考虑其他条件的情况下,完成识别或检测是一件非常简单的事情,这样的项目显然并不能帮助我们胜过其他求职者。更要命的是,现在已经5月末了,就算Data岗HC再多,也架不住眼下有一众科班+转码选手都在虎视眈眈啊……
本计划联合国内顶级科技公司资深数据科学家,全程一对一指导分阶段授课,在面试知识、求职技能、工业界项目多方面全方位助你快速补齐面试技能短板,迅速提升!- 数据科学、大数据、统计学等相关专业方向的各个年级的同学及在职工程师;
- 知识体系不全面,存在面试需求的盲点或弱点,想要定制化课程快速实现突破和大幅度技能提升的同学。
* 本文原创于直通硅谷【https://www.zhitongguigu.com】,欢迎尊重版权的转载。一般转载请在文章开头或结尾正确注明以下信息:直通硅谷,北美最专业的IT求职培训机构,留学生科技求职最佳选择。封面:From Wikimedia Commons, the free media repository https://commons.wikimedia.org/wiki/File:Google_data_center.jpg Author:Lambtron