Redian新闻
>
数据分析终极难题:多影响因素下,归因模型怎么搭建?

数据分析终极难题:多影响因素下,归因模型怎么搭建?

公众号新闻
数据分析领域有几个经典的终极难题。多影响因素归因,绝对是其中最让人头大的。特别是临近促销旺季,品牌、售后、客服、供应链、运营、产品、商品管理都会跑来,说:“今年业绩不错呀,公司多赚的10个亿,到底几个亿归功于品牌,到底几个亿归功于供应……请量化分析一下,谢谢”。
那么,到底该怎么分析呢?今天我们详细讲解一下。

多影响因素归因的表面

为啥这个问题是终极难题,只要做一个实验,马上便知道。
同学们可以亲自试试哦

第一步:请闭上眼睛

第二步:回忆淘宝里最近买的一件商品

第三步:在脑海里回忆该商品的名称、包装、价格、品牌、客服小妹声音……

第四步:睁开眼,告诉自己:我为这个商品付费的XXX钱,其中有X%是付给名称,X%付给包装,X%付费给商品上blingbling的广告,X%付给快递叔叔……
答得出来不?

不但很难答出来,估计很多同学连最近买的是啥都不记得了。

消费者不是所有消费都理性。

消费者不是所有商品都重视。

商家提供的品牌、服务、产品本身就是一个整体。

因此站在消费者角度,这个问题从源头上就不成立。特别是啤酒瓜子矿泉水一类的快消类产品。价格低,消费频次高,冲动消费多,心情好了就买点,心情不好了也买点,因此很难讲清楚。
大宗耐用品,比如房子、车子可能思考得多一些,有一定概率区分出来,但是仍然很难量化到每个因素的得分,如果怀疑这点的,想象你结婚那一刻你(也许是你老婆)有多纠结,就秒懂了,哈哈。
那么问题来了:为啥明知道分不清楚,各个部门还一而再、再而三要求分家呢?
这就触及到问题的本质:大家的屁股坐在哪里。

多影响因素归因的本质

表象上看,多影响因素归因,难在很难拆解数据。
本质上看,多影响因素归因,只是部门间分赃不均的结果。
每个部门都太急于证明自己的价值,总想努力跟业绩指标挂上联系。
特别在年底,要为部门争取奖金,要为明年争取预算,分家的冲动就更高。
因此,多影响因素归因,本质上是在衡量部门价值,这才是核心难点。
很多同学会忽视这个核心问题,用一些简单的数据方法处理。比如:把各个部门的费用设为x,把业绩设为y然后怼一个线性回归模型出来。然后把各个参数的系数视为贡献大小。且不说,这么干,首先完全误会了回归模型的含义;其次,也没有考虑分类变量和连续变量的问题。单纯就结果本身,也会被人喷死。
比如,算出来销售的系数是2,供应链的系数是1,那明年多找2倍的销售,却只提供1倍的商品,还能有这个销售业绩吗?肯定不可能啊,有枪没子弹啊!部门之间分工合作,不是简单的1+1=2的关系,这是常识。因此强行割裂部门间联系,把不同分类的部门拉在一起评价,是注定要扑街的。
因此,破局思路,在于从一开始,就应该直接否掉这种一条公式打天下的想法。从部门工作性质出发,建立科学的衡量机制,从而有效化解这种立功焦虑。

破局思路

想破局,首先得分清各个部门的工作类型与贡献方式(如下图):
之后,就可以分门别类进行分析考察。
软支持类:放弃直接关联销售业绩,按需分配。

软支持的核心问题,在于不能自证清白。对于品牌宣传而言,即使所有宣传都带链接,导流到购买页面,也无法证明到底用户购买是多大因为品牌,甚至这些年爆款打法、网红带货,都在可以弱化品牌,突出产品功能和粉丝效应。

况且,至少6成以上的品牌宣传,根本连带货链接都没有(比如上市前的宣传),就更无从谈起了。客服、售后也同理,虽然顾客找上门来的时候,这两者服务很重要。但是主动发起的客户比例少,因此很难关联整体业绩。
这种不做不行,做了说不清楚效果的事,最好直接按整体业绩比例分配资源,考核自身的效果,而不是非要强行关联销售业绩。
比如根据产品生命周期/时间,配置宣传力度(如下图)宣传能达成足够市场认知,覆盖足够人数(考核点击、转发、阅读数等等)即完成任务。
比如客服、售后。根据业务总量分配资源和人力。考核本身服务满意度,服务覆盖率,从呼叫到响应的速度,严重投诉/风险事件的应对速度,等等。做好本职工作及完成任务。
硬支持类:考核。
硬支持类的考核就简单清晰很多:供给到位,损耗降低。并且追求的是峰值控制与长期水平的下降。太过计较一城一地得失,反而容易定出来很死板的流程,搞出很多乌龙(如下图)
硬拉动类:引入ABtest机制,提前预设目标。
硬拉动类,属于叠加buff的做法,因此必须事先设好控制变量,否则混在一堆因素里,事后根本无法拆分。比如事先设定好拉动的总目标,事先测试方案效果,事中余留参照组,采集过程数据,这样才能在事后做好区分。
硬拉动类是可以评估的,问题总是出在:事先不做工作,事中不留参照,不踩数据。啥都没有,事后能分析出来就见鬼了。
核心流程:建立分级机制,深入分析影响。
核心流程里,销售和产品互怼的事也很常见,但是这种互怼是可以分析出,到底过错在谁那边的。只要建立好分级机制,对渠道质量、商品属性进行打标签分析,监控过程转化率,是可以做深入分析的,因此核心流程尽量多做分析,不留扯皮空间(如下图)。
现实永远很骨感
以上只是理想状态下的建议,实际开工:
  • 总有人想争取更多资源,大喊:“品效合一!”“心智资源!”
  • 总有人认为客服售后没必要,今年再扣他点费用?(从而引发服务部门的奋起反击“老子也有贡献!”)
  • 总有人喜欢夸大自己贡献,促销活动效益写的巨高,甚至比自然销量还高。
  • 总有人怕被追究责任,拼命往:没有促销!没有支持!产品不给力上推责任。
所以有关“到底每个部门贡献多少,能不能具体到每一块钱里几毛几分是谁来的”的议题,永远不会停下来。
加之,总有新入行的数据分析师,认为只要怼几个数据进线性回归或者因子分析模型,就能算个参数出来让每个部门满意。所以这种来来回回扯皮的事,还会延续很多很多年,哈哈哈。

小结

类似的数据分析千古难题,还有很多:
  • 为什么ABtest中实验有效,投产没效,到底怎么测得准!
  • 自然增长率要怎么计算,才是全宇宙最公平合理的!
  • 用户心智资源的开发与认知深度的变化,如何衡量!
  • 销售预测,到底怎么才能预测100%精准!
  • ……
每一个问题,都是表面看似数据分析,背后是人心贪婪,推过揽功。业绩好了就说是自己做的,业绩不好就甩给外部因素和内部各种无法量化的因素,以图自保。

源 | 接地气的陈老师(ID:gh_abf29df6ada8

作者 | 接地气的陈老师 ;编辑 | 荔枝

内容仅代表作者独立观点,不代表早读课立场



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
农小蜂:2023年中国玉米产业数据分析简报很想一次性讲清楚:数据分析师有必要转数据产品经理么?【限时免费】破解CFA题目理解难题:速领2000词金融专业词汇大全PDF数据分析师噩梦?ChatGPT实时互动分析Excel数据,网友挖出背后新模型偷窃、殴打、校园霸凌、团体虐杀...... 青少年犯罪成世界性难题:我们的孩子因何残忍?【血液科】2023年发表的SCI论文大数据分析美股基本面 - 2024_02_04 * 晨报 * 红海局势持续紧张 苏伊士运河1月收入锐减近一半。那些被GLP-1吓到的美股中文得分世界第一,多项盲测并肩 GPT4o,这个国产大模型怎么就成了 AI 界的黑马?外婆要买的三大件计算机科学里最大的难题:居中显示【麻醉科】2023年发表的SCI论文大数据分析求职干货 | 海归求职:数据(数据分析、数据科学、工程)狼子野心暴露 #郭文貴 開辦農場大肆斂財如何按照影响因子,筛选PubMed检索结果?(2024)马上开始|BAT资深数据分析师为你带来《数据求职暑期备战指南》这个环境下,如何体现数据分析的价值?《阴阳鱼》连载第17章:时间如刀,空间如砧板,而你我都不过是鱼肉为什么总是内耗,可能是归因方式错了 !2024年8款数据库数据分析能力(TPC-H)真实性能评测,真有100倍差距技术盛宴 | 浅谈LLM推理性能的影响因子——HBD Size58同城孙启明:生活服务垂类大模型怎么搭?自研+开源两手抓,火速微调上线Llama 3|GenAICon20242024年企业最大难题:现金or资产?为什么总是内耗,可能是归因方式错了为什么总是内耗,可能是归因方式错了 |【经纬低调分享】梁朝伟怪可怜的,拿那么多影帝有什么用求职干货|TikTok 2024 春招已开!海外求职:数据(数据分析、数据科学、工程)​久等了!17款GUCCI爆款首饰,怎么搭都好看!宏观市场 | 股权风险溢价的度量和影响因素今日全职|巴克莱招聘市场数据分析师,要求有业务分析经验!年轻人的新难题:你是情绪垃圾制造者?还是情绪垃圾桶?人生难题:租房 or 买房?BMJ子刊研究显示:相比于有房人,租房住的老得更快!该影响超过失业和吸烟!中国式难题:“不成家,非必要不独居”做数据十年,第一次见这么棒的数据分析方法如何降低数据消费门槛,让非技术用户也能成为数据分析专家?我有一雙可愛的雙胞胎兒女
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。