面经总结|大厂数据分析岗位面经流出,看完想不上岸都难……
Offer帮官网:offerbang.io
随着2022年进入尾声,留学生们也迎来了求职季。面对大厂诱人的Offer,相信大家都跃跃欲试了吧!那么,想要从事数据分析的你有没有选到心仪的公司,并且准备好面试呢?
今天我们为大家准备了一些国内外各大厂的面试真题,小伙伴们可以尝试练习,检验一下自己的学习成果哦~
01
咨询类面试真题
在咨询行业求职时,一定绕不开十大咨询公司。因此,我们为大家准备了BCG、McKinsey及Accenture的面试真题,相信看过以下真题的你,一定对资讯类面试有新的感悟。
|波士顿咨询公司
题目描述:已知某公司的产品种类包含了以下五个战略业务单位。首先,请用投资分析确定每个战略的相对市场份额,并说明这家公司是否运行正常;其次,请叙述波士顿市场成长一份额矩阵的本质,并为高层管理者今后的战略提出建议。
STEP 1:利用公式“业务单位相对市场占有率=业务单位销售额/业务单位最大竞争对手销售额”,计算各业务单位相对市场占有率。例如:A=0.5\0.7=0.71,由此得出B、C、D、E、分别为1、1、1、0.2。
STEP 2:建立矩阵,并逐一分析各个业务单位。例如:业务单位A的高市场成长率为15%,低市场占有率0.71, 竞争者数目为8。因此,相对于其他业务单位而言,A的竞争还不算激烈,公司应加大投资,建议以市场份额为战略目标,加大广告投入,抢抓市场机会,赶超最大竞争对手。
题目解答:总体而言,这家公司基本运行正常,有1个问题类业务,1个即将成为明星类业务,2个奶牛业务,一个瘦狗类业务。有较强的资金供应能力,资金断链的可能性不太大。同时拥有未来利润源,A和B业务均可通过努力成为公司很好的利润增长点,但其并没真正完全掌握市场主导权,且市场竞争激烈,有较大可能性是去未来竞争力。
|麦肯锡
题目描述:香港工银大厦楼下的星巴克一年的咖啡销售额是多少?
STEP 1:找到供给能力的瓶颈。假设平均点单+收银时间是1分钟,制作咖啡则需要2分钟,那么在整个链条上,瓶颈是在“制作咖啡”上。
STEP 2:一般星巴克有两台咖啡机,每台最多可以做两杯咖啡,所以一家店同时最多只能做4杯咖啡。但星巴克不总是在排队,因此可以把他们每天的营业时间划分为忙时和闲时。忙时的产能为每两分钟做4杯,也就是平均每分钟2杯;而闲时的产能利用率可能稍微低一些 ,平均每分钟只生产0.4杯。
题目解答:一天忙时销量为: 2x60x4=480杯,一天的闲时销量为: 0.4x60x8=192杯。假设咖啡平均30块一杯,那么一天的咖啡销售额就是: 30x(480+ 192)=20160元,一年的咖啡销售额则是: 20160x 365=736万元。
|埃森哲
题目1: 特征选择和特征提取有什么区别?
题目解答:特征选择(Feature selection)即从原来的特征中选出子集,特征的性质和原来的特征保持一致。特征提取(Feature reduction)指通过原来存在的特征的集合创造一个新的特征子集,改变了原本的特征的性质。
题目描述:定义ACID的属性。
题目解答:ACID 是指在可靠数据库管理系统中事务所应该具有的四个特性,即原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。
题目3: 数据定义语言与数据操作语言之间的区别是什么?
题目解答:数据操纵语言(DML)适用于对数据库中的数据进行一些简单操作, 如Insert,Delete和Select等。而数据定义语言(DDL)适用于对数据库中的某些对象进行管理,如Create,Alter和Drop。因此,两者的区别在于:DML操作是可以手动控制事务的开启、提交和回滚的;而DDL操作是隐性提交的,不能Rollback。
02
金融类面试真题
大数据时代,数据分析在金融行业的广泛应用已经是不可阻挡的趋势,也为金融行业带来了新的机遇。对此心动的小伙伴不妨通过以下几道题对自己做个检测。
|招商银行
题目1: 以下python语句(Python 2.7.13)的执行结果是?
A[ 'mat', 'hat']
B[‘cat’, ‘pat’]
C[‘mat’, ‘hat’, ‘pat’]
D[]
题目解答:左方括号后跟^表示非什么什么,因此本题要选择非c或p开头的选项,只有[ 'mat', 'hat']符合条件,答案选A。
题目2: 常用的Python库有哪些?
题目解答:常用的Python库包括九种,分别是:
1)Numpy,矩阵运算
2)Sklearn,常用机器学习和数据挖掘工具库
3)Scipy,基于Numpy做高效的数学计算
4)Pandas,将数据用表的形式进行操作
5)Matplotlib,数据可视化工具
6)Seaborn,数据可视化工具
7)Keras/Tensorflow/Theano,深度学习工具包
8)NLTK,自然语言处理工具包
9)Beautifulsoap,网页文档解析工具
题目3:又到一年毕业季,一大批刚刚步入职场的应届生申请办理我行信用卡。为最大程度地得到优质的信用卡客户,我行考虑利用机器学习为传统人工作辅助决策。针对这个场景,请详细描述所需要的数据、数据的处理过程、选择的算法、评价指标等过程。
题目解答:首先,需要用户个人的基本属性信息数据,以及信用特征如贷款信息,还需要用户的行为信息数据,如已办理的其它信用卡使用情况。其次,文本型数值需要进行编码处理,数值型的需要进行同度量化等,可以利用传统的规则识别和一些分类算法如LR、Cart、RF等进行数据处理。最后,指标可以选择ROC曲线的AUC值、KS值、F1值,准确率和召回率等。
|PAYPAL
假设本次笔试的通过率为50%。95%通过笔试的同学觉得他们笔试答得很好,而75%未通过笔试的同学也觉得他们的笔试答得很好。那么,如果你觉得这次笔试你答得很好,你通过这次笔试的概率有多少?
利用贝叶斯概率,计算通过率P(过)=50%,P (感觉好|过) =95%,P(感觉好|不过)=75%;最终求解的是P(过|感觉好)。
题目解答:P(感觉好)=P(感觉好|过)*P(过)+P(感觉好|不过)*P(不过)=0.95*0.5+0.75*0.5 =0.85;P(过|感觉好)=P(感觉好|过)*P(过)/P(感觉好)0.95*0.5/0.85=0.5588,约等于0.56(56%)。因此,“我”通过这次笔试的概率为56%。
|花旗银行
假设您在一家大型信用卡公司工作,并获得了一个包含600,000笔信用卡交易的数据集,请使用此数据集构建欺诈检测模型。
题目解答:
1)首先需要考虑三个问题,即欺诈交易发生的频率到底有多高?我们是怎样获得欺诈数据的?用户是否真的存在欺诈行为?从而确定能够将哪些数据点作为欺诈交易的响应变量。
2)建立增强模型和算法帮助解决数据不平衡的问题。
3)还需要创建成本/收益分析,以表明我们对假阳性、真阳性、真阴性和假阴性的重视程度。一般来说,假阴性(没有发现欺诈行为)比假阳性更糟糕;假阳性是一种被标记为欺诈的常规交易,如果我们可以有效地评估这些错误分类,就可以确定在哪里选择概率阈值,在这个阈值上我们将交易标记为欺诈。
03
互联网类面试真题
互联网作为离不开数据的行业,面试中对应试者数据分析的能力非常看中。我们已为您整理好阿里巴巴以及微软近几年的面试真题,一起来看看吧!
|阿里巴巴
以下对K-means聚类算法解释正确的是?
A、能自动识别类的个数,随即挑选初始点为中心点计算
B、能自动识别类的个数,不是随即挑选初始点为中心点计算
C、不能自动识别类的个数,随即挑选初始点为中心点计算
D、不能自动识别类的个数,不是随即挑选初始点为中心点计算
KMeans (C均值) 算法的具体步骤为:
1)适当选择C个类的初始中心;
2)在第K次迭代中,对任意一个样本,求其到C个中心的距离,将该样本归到距离最短的中心所在的类;
3)利用均值等方法更新该类的中心值;
4)对于所有的C个聚类中心,如果利用(2)(3)的迭代法更新后,值保持不变,则迭代结束,否则继续迭代。
题目解答:由以上算法的具体步骤,可以看出需要选择类别数量,但初次选择是随机的,最终的聚类中心是不断迭代稳定以后的聚类中心,所以答案选C。
|Microsoft
题目1: 请定义和解释聚簇索引和非聚簇索引之间的差异。
题目解答:聚簇索引就是主键索引,用于确定一行数据的标识,主键索引可以唯一确定一行数据。而非聚簇索引则相反,需要先确定主键索引后,再通过主键索引确定数据。
题目2: 返回表的行计数有哪些不同的方法?
题目解答:1)count(*);2)SQL Server对着表右击、属性存储、行计数;3)SQL Server-HOW-TO: quickly retrieve accurate row count for table.
04
市场类面试真题
企业管理者通过大数据的分析,能够迅速了解消费者的需求变化和市场发展趋势,从而帮助企业做出正确的决策,以此提高企业在市场上的竞争力。面对如此重要的岗位职责,市场类的面试真题也不能马虎对待哦~
|小红书
题目1: 已知2-5月环比增长速度分别为5.6%、7.1%、8.5%、6.4%,则5月对比1月的增速是?
A、5.6%x7.1%x8.5%x6.4%
B、(105.6%x107.1%x108.5%x106.4%)-100%
C、(5.6%x7.1%x8.5%x6.4%)+100%
D、105.6%x107.1%x108.5%x106.4%
题目解答:本题主要考察考察定基增速与环比增速。5月对比1月的增速是定基增长速度,定基增速与环比增速两者之间没有直接的换算关系,在由环比增长速度推算定基增长速度时,可先将各环比增长速度加1后连乘,再将结果减1,即得定基增长速度(105.6%x107.1%x108.5%x106.4%)-100%,答案选B。
题目2:下表是某电商在不同品类不同月份的销量数据,请完成以下操作:
1)用Sumif或Sumifs在F3单元格实现计算洗面奶在201901的销量;
2)用函数实现计算洗面奶有几个月的销量超过了100万;
3)用函数计算洗面奶这个品类的月复合增长率。
Step 1: 第一小问考察SUMIFS函数用法。SUMIFS函数是用来进行条件求和的,该函数至少有三部分参数,即Sum_range、Criteral range和Criterl。
Step 2: 第二小问考察COUNTIFS函数的用法,COUNTIFS函数是用来进行条件计数的,它的参数包括Criteria range[N]和Criteria[N]。
Step 3: 复合增长率的计算公式为:(现有价值/基础价值)^(1/期数)-1。因此洗面奶的月复合增长率可以用Power函数计算乘幕。
题目解答:
1)=SUMIFS(C4:C15,B4:B15,E4,A4:A15,F3)
2)=COUNTIFS(B2:B13,B2,C2:C13,">100")
3)=pow(160/120,1/3)-1
以上就是今天的全部内容了。希望大家面试顺利,早日收到令你心动的Offer。但是如果你对数据分析的面试没有把握的话也没关系,《数据/商业分析求职实战营》来了,你想要的数据分析知识点和面试经验,它都有!
《数据/商业分析求职实战营》
名企项目+面试刷题+Technical提升一站搞定
///
专业导师团队带你学习数据/商业分析求职必修课,华丽转身为集万千宠爱的大数据人才
关于课程
无论是金融,咨询,还是科技大厂,掌握核心技能,解锁职场更多潜能!
Offer帮DA/BA精品实战集训营带你绝地求生,突出重围。由咨询名企,投行和FLAG招聘官教研组,用心研发,以知识学习为导向,分为核心技能、实战项目和真题实训全覆盖3部分,高效学习求职必备Technical,帮你掌握核心技能,占领人才缺口,高效拿Offer!
课程收获
✅ 从0到1,全面掌握Python编程基础、数据处理包及机器学习
✅ 快速掌握数据库基础知识及必备SQL数据库查询筛选语句
✅ 快速掌握实用R语言,进阶Excel,VBA等分析工具
✅ 名企实战项目,为简历加分
适合人群
商科/文科转数据/商业分析的
零基础宝宝
希望提升数据/商业分析背景的
丰富简历经历的求职者
希望拥有业界认可的技能的
职场新人
《数据/商业分析求职实战营》以全面提升技能为导向,带你从0到1全面掌握Python, SQL, R, Excel, VBA等必备分析语言及工具。DA/BA求职极其看重相关经历,集训营含海内外知名公司的真实项目,可以有效提高简历含金量,增加通过初筛概率!
Technical部分老师会深入浅出地讲解,再讲题,手把手一步步带着做项目,确保同学掌握。
扫码了解课程详情
Dianna
Offer帮课程顾问
名企导师天团
名企招聘官教研组,阅人无数,拥有丰富的招聘和辅导经验,对数据岗位面试知识点和考点有深刻的理解和把握。数据集训营由教研组结合咨询和数据分析岗位多年工作经验研发,倾囊相助。课上同学可以和导师互动,确保实时答疑。
Tong
麦肯锡数据分析师
Chris
FLAG数据分析师
Kevin
纽约九大投行基金数据分析师
Jack
JP Morgan结构化产品
每周我们都安排了相应的答疑时间,大家可以在答疑课上和老师互动,及时解决问题。如果课前有将问题整理好,也可以发在交流群或发给班主任/助教,我们会整理后反馈给老师课上答疑。
行业名企实战项目
不同于学校的纯知识性课程,Offer帮求职集训营以求职为导向,全面覆盖必备行业知识,Technical方面以必备知识为依托,全面结合实际应用,用大厂实战项目提升技能,丰富经历。
同时,课程会详细讲解求职方方面面及技巧,让同学对求职整个过程有清晰的目标和规划。
Offer帮
扫描二维码免费试听
Dianna
Offer帮课程顾问
课程大纲
数据分析技能全覆盖,带你掌握数据分析必备的知识技能,熟练掌握面试问题。同时通过海内外知名企业实战项目提高简历通过率,助你拿到大厂Offer!
第一讲 | Python重点语句及知识点详解(选修) |
第二讲 | 课后实操 – Python典型考题精析,Q&A |
第三讲 | 常用数据分析 Python Package 使用技巧 – NumPy |
第四讲 | 常用数据分析 Python Package 使用技巧 – Pandas |
第五讲 | 时间序列处理及数据可视化 - Datetime & Matplotlib |
第六讲 | Machine Learning基础及相关Package介绍 |
第七讲 | 名企项目实操 - McKinsey商业分析实战,房产定价模型的搭建与分析,Q&A |
第八讲 | 数据库基础知识及 SQL 常用数据查询与数据筛选语句解析 |
第九讲 | 课后实操 – SQL典型考题精析,Q&A |
第十讲 | R语言常用语句及应用技巧 |
第十一讲 | Excel Macro & VBA 基础及应用 |
第十二讲 | 名企项目实战 - Morgan Stanley数据分析实战,量化交易投资组合数据分析,Q&A |
创新自主学习平台
课程由录播与直播相结合,课程有效期内,Offer帮为你提供免费无限次课程回放,帮助你补课或者反复复习,满足你的时间弹性和多次学习需要。
现在报名还可获得
寒假限时特惠
$100优惠
报名单门课程即可享受
$500优惠
报名2门及以上课程可享受
💎现在报名还有额外惊喜福利
0元领原价$199求职入门课
限时优惠 名额有限
赶快扫描小助手二维码
咨询活动&课程详情吧
近期学员Offer榜
金融、咨询、数据等多个领域的Offer展示
能展示出的Offer只是冰山一角,这一份份实打实、沉甸甸的Offer,让我们团队的每一个人都倍感自豪。在未来的道路上,Offer帮会继续脚踏实地,用专业、诚信、用心的原则,助力所有学员的求职之路!
(点击图片即可查看大图)
微信扫码关注该文公众号作者