Redian新闻
>
一篇“不太科学”的数据科学文章

一篇“不太科学”的数据科学文章

科学
创刊于1922年的《哈佛商业评论》(Harvard Business Review,以下简称HBR),是哈佛商学院的标志性刊物,因其关于商业战略的文章而闻名,也被业界誉为“管理圣经”。
然而,它在技术内容方面的文章可能就不是这样了,下面要讲的这篇文章就是一个例子。
2018年,HBR的网站上发表了一篇名为《用这个2×2矩阵优先考虑你的公司需要哪些数据技能》(Prioritize Which Data Skills Your Company Needs with This 2×2 Matrix.)的文章。
HBR最喜欢的就是把问题做一个2x2的矩阵,这样讲故事确实很容易follow,但是这篇文章却有很多问题,甚至还可能带来风险。
为什么说它可能存在风险呢?
首先,它引导人们以一种不太实际甚至可能是错误的方式来思考数据科学。这一点稍后会详细说明。
更明显的风险是,不了解情况的人还可能会用这篇文章来指导实际中公司的数据战略。
不仅如此,这还可能会给许多数据专业的人员带来困扰,并让他们感觉自己的经验和技能都受到了贬损。
所以,这篇文章到底讲了什么?
其实,这篇文章基本上是复制粘贴了一个著名的战略商业框架,并试图将其应用于数据技能的学习和提升。
作者使用了一个成本效益矩阵,其中“成本”是学习一项数据技能所需的「时间」,代表着个人或团队获得该技能的机会成本;而“效益”是该数据技能对组织的「效用」,指的是个人或组织有多大可能需要这项技能,这代表它能为个人职业前景的增益,或为公司增加的价值。
结合「时间」和「效用」,作者列出了一个简单的2X2四象限矩阵,并标注为「学习」(Learn)、「计划」(Plan)、「浏览」(Browse)「忽略」(Ignore)
作者认为,这是一个有用的框架,可以帮助确定需要花时间投资于哪些数据技能。
接着,作者又列出了下面这个更为细化的矩阵来说明具体需要学习的技能有哪些。而这些技能的优先次序,则是根据职业相关技能在招聘、新闻报道和学习者反馈中出现的频率来决定的。
这在理论上初看起来不错。
矩阵确实是有用的战略框架,可以帮助人们根据几个关键的考虑因素来确定优先次序(尽管它们在实践中往往被过度使用,而且它们的轴线往往不像人们认为的那样独立)。
那么,这篇文章存在哪些问题呢?
首先,大部分有经验的数据专业人员看这篇文章尤其是这个矩阵的时候可能都会感觉不太对劲。
这里就列出其中最明显的几点。
1)正如上面提到的,这些技能不能简单地逐项考虑,也不能独立考虑。
不学习统计学,怎么能学习统计编程?「数据科学」(Data Science)与「机器学习」(Machine Learning)、「预测性分析」(Predictive Analytics)和其他几个列出的技能有什么不同?「财务分析」(financial analysis)与「商业智能」(business intelligence)又有哪些区别?
试想一个这样的场景:一位企业高管告诉他的数据科学家要专注于数据可视化,但不要考虑数据清洗的问题。
2)这篇文章暗示:有些技能是「容易的」,有些是「更有用的」。
诸如「没有用」(Not useful)「不费时」(Not time-consuming to acquire)这样的二元陈述都是在表明这种贬损性质。这本身就是有问题的,对数据或分析功能持这种观点的人,都带有一种无形的职业或等级歧视。
绝大多数的数据和分析活动都需要专业的技能或知识,而认为其中一些技能更容易学习,或是比其他技能更有用或更没用,显然是不太合适的。
3)这篇文章强调,所说明的优先权只是一个例子。但一个例子只有在可信的情况下才是有用的,而文章中的这个例子看上去并不是那么可信。
再试想一下,在没有良好的数据清洗和数据仓库,或者没有数学或统计学知识的情况下做数据科学。可以肯定,结果不会很好。
如果数据可视化技能是「不费时的」,为什么优秀的数据可视化专业人员这么难找,而且需求量这么大?
有经验的读者可能还会在这个矩阵上挑出更多不合适的地方。
从本质上讲,这篇文章使用了一个不太合适的说明性例子,试图将一个框架代入实际应用。
当你剔除这些不合适之处时,剩下的只是一个空洞的框架,它无法应用于数据技能的学习或提升,因为它们太复杂,也很难以这种方式逐项列出。
无论是这篇文章还是之前麦教授提到的那篇报告(海外机构投资者怎么看第四季度的A股。。。让人吐血的报告),我们在阅读这样的内容时,尤其是需要将其中的理论或框架应用于实际生产生活中时,都应该结合实际提出问题多加思考,并采用一种更加合适的方法应用到实践中。
往期回顾

看懂已知、未知和不可知

2022-10-27

今年的诺贝尔经济学奖有哪些看点

2022-10-11

能用量化的思维来解读巴菲特吗?

2022-09-28

海外机构投资者怎么看第四季度的A股。。。让人吐血的报告

2022-09-15

越无所不知,越一无所知

2022-08-31


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
求职干货|拼多多 2023秋招补录已开!海归求职:数据(数据分析、数据科学、工程)美国档案--黄佐庭吴炳新宦祥生,资料贴,冗长枯燥今日实习|麦肯锡数据科学实习开启!理工学院二年级学生速投!数据科学面试中你应该知道的10个高级SQL概念冲刺秋招 | 数据科学求职优培20计划11月11日启动!求职干货|Amazon 2023 暑期实习已开!海外求职:数据(数据分析、数据科学、工程)​香港中文大学(深圳)数据科学学院招聘博士后 - 分布式优化和机器学习方向是不够爱,还是向命运妥协?不要让百万年薪成为学习数据科学的唯一借口!暴击!在家长群里写了篇“小作文”,我被赤裸裸地鄙视了!上海数据交易所&普华永道:数据要素视角下的数据资产化研究(97页)求职干货 | 华为等企业2023秋招已开!海归求职:数据(数据分析、数据科学、工程)行业入门|数据科学,一个被称为21世纪“最性感”的行业管涛:美元是唯一的中心货币 美国不太平、世界都不太平盘点2022年的数据库/数据仓库/数据湖市场(上)。。。会议通知 | “统计与数据科学”青年研究者工作坊第2期:学科交叉研究经验分享会实习速递|Uber开放2023数据科学类实习项目,理工科专业速投!冲刺秋招 | 数据科学求职优培20计划11月25日启动!加拿大在重商主义秩序中的角色小赌怡情 20大七常委资深预测新鲜出炉Pandas:用于数据分析和数据科学的最热门 Python 库 | Linux 中国没有自己的数据怎么发SCI?用好这些公共数据库和数据缺失处理方法,发表SCI并不难!新泽西理工学院数据科学系、计算机系王丽晶老师招收多名博士那年火车上的故事(下集)(一)被解雇的 Twitter 数据科学经理扬言起诉马斯克:绩效优良,但因怀孕被裁员实习速递|麦肯锡数据科学实习开启!理工学院二年级学生速投!求职干货 | 华为、DELL等2023秋招已开!海归求职:数据(数据分析、数据科学、工程)生肖游戏Kaggle全球数据科学家薪酬大揭秘:俄罗斯竟力压美国成第一!博士申请 | ​美国芝加哥大学徐海峰老师招收数据科学方向全奖博士生如何成为全栈数据科学家?对人工智能、数据科学感兴趣?不如先来实践一下!尚太科技深交所上市:预计年营收超50亿 市值127亿刚刚,微信"史诗级"新功能开放!突发,又一银行行长被双开!一篇“小作文”,700亿果链龙头直线涨停!今日实习|麦肯锡开放数据科学实习项目,不限学科!戏精上身的论文致谢......谢谢自己,为科研界产出一篇“垃圾”
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。