Redian新闻
>
数据科学研究生申请:AI时代的专业选择

数据科学研究生申请:AI时代的专业选择

公众号新闻

"编者按

《ALPHA专业百科全书》将会是一个系列的专业申请攻略,从商科开始到工程、教育、科学、社会学、艺术等108个几乎覆盖美国研究生院所有专业的完整指南,其目的是给学生提供尽可能多和全面的专业申请信息,帮助申请人做最优的申请决策。”


本次推出的《专业百科全书》是“数据科学”,我们将在下文详细叙述数据科学研究生申请需要了解的一切,包括:

1.AI时代的专业选择
2.数据科学介绍
3.你适合申请数据科学专业研究生吗?
3.1哪些专业背景适合申请数据科学专业?
3.2数据科学家是干什么的?基本能力要求有哪些?
3.3自我评估:你适合申请数据科学研究生吗?
4.美国数据科学硕士专业介绍
5.数据科学硕士项目推荐
6.数据科学申请案例分享
7.数据科学申请建议

共计12484字,约需要30分钟完成全文阅读,建议收藏。 

01

 AI时代的 

 专业选择 


2023年,3月15日,美国人工智能研究实验室OpenAI为其爆红聊天机器人ChatGPT发布了最新GPT4语言模型,

未来,它可以代替人处理各种客户服务,使用各国语言进行个性化的服务,24/7全年无需休息;可以代替许多内容编辑从互联网读取资源,生成各种类型的文本内容,快捷高效;可以代替视频编辑快速生成视频……

有人说,ChatGPT开启了人工智能(AI)时代。

站在AI时代的节点,我们要怎么选专业?

在最近的精英日课中,就有读者问万维钢:“请问万sir,对于Data Science(数据科学)或者AI之间有什么看法,如果目前你的儿子就要选修硕士的话,你怎么建议?”

万维钢,知名的科技作家、企业家,曾任职于Google Brain团队,专注于深度学习和人工智能的研究,是Facebook人工智能实验室的创始成员之一。他的书《人工智能简史》被广泛认为是人工智能领域的经典之作。

万维钢说,我大概会建议他选数据科学。

他讲了以GPT4为代表的大型语言模型浪潮对NLP(自然语言处理(Natural Language Processing)的影响。

很多大学都有NLP这个专业,很多大公司有专门的NLP研发团队。NLP是计算机科学、AI和人类语言学的交叉学科,此前一直被认为是实现通用人工智能的指望。NLP研究的是如何让机器理解人的语言,它的应用范围包括机器翻译、语音识别、搜索引擎、智能助手等等。这么多年以来,NLP领域在无数人的努力之下,取得了很多成就……

然而NLP正在被GPT4维代表的大型语言模型浪潮杀死。

GPT用的是完全不同的解决思路——无监督学习。它不需要按照人类帮它寻找的语言规则去学习语言(NLP一直以来的研究领域),原来机器自动就能找到各种我们知道——包括我们不知道——的语言规律,翻译也好、语音识别也好、搜索引擎和智能助手也好,都是GPT原生就有的功能。而且它还自动掌握了一大堆包括逻辑推理、少量本学习、自动分类等等功能,还有我们没意识到的功能。

GPT的出现,让人们发现,“原来让计算机通过大量语言读取,直接暴力破解次才是最根本、最快、最好的办法”万维钢说道。

其实被颠覆的不仅仅是NLP这一个学科,其他AI学科,比如贝叶斯分析学派,也都面临危机。

所以赌一门过于狭窄的技术是危险的。而相对AI来说,数据科学的应用范围更广,就算将来AI接管数据分析,你还可以用相关的知识帮助别人理解数据和根据数据做决策,所以在AI时代,这是一个更加安全的选择。

无论在医疗健康、商业决策、社交媒体、交通规划,还是环保领域,它都能发挥出巨大的作用。数据科学家们预测疾病、引导企业做出明智的决策、推荐你感兴趣的内容、规划最佳的出行路线,甚甚至帮助我们更好地保护环境。

《哈佛商业评论》将数据科学家评为“二十一世纪最性感的职业”。

在美国,综合年薪、工作满意度以及在Glassdoor开放的岗位数目,数据科学家在美国最大的求职网站之一Glassdoor 美国最佳工作(Best jobs in America) 排名,连续五年稳居第前三,平均年薪维持在10万美元之上,成为美国最为炙手可热的职业之一。


今天我们就来谈谈,这个AI时代仍具有竞争力的“21世纪最性感职业”——数据科学(Data Science)。

02

 数据科学 

 介绍 


在聊申请之前,让我们首先明确数据科学究竟研究什么,以及它在我们生活中究竟是如何应用的。

科学数据的定义

随着互联网的发展,产生了越来越多的数据,而能够有效分析这些数据并将它们应用于商业的人才却极其短缺,在这种趋势下,数据科学专业应运而生。

数据科学(英语:Data Science),是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。


从上图可以看出,数据科学是一门横跨多领域的交叉学科,这些学科包括:计算机科学、数学、统计学、商科以及其他应用领域。

有人说数据是当今世界的石油,借助合适的工具,技术,算法,我们可以使用数据并将其转换为独特的业务优势。

而这就是数据科学家们正在做的——

挖掘数据的科学价值,进行数据领域的底层技术研发。

数据科学的应用领域

数据和数据分析已经深深地影响和作用于我们的生活,其在各行各业的应用也极大提高了我们的生活的便利度和产出效率。

政府就可以通过对大数据的不同应用及时高效地监测到问题,为制定相关方针政策服务。

比如基于大数据分析,找出雾霾的根源在哪里,是因为车辆尾气还是因为钢厂排放,堵车问题的解决是通过修路还是改变出行方式,或是建立副中心,而不仅仅是通过一刀切的限号方式来解决。又比如美国国家税务局已经在它的返回审查程序中集成了大数据分析功能:通过分析大量的数据,美国国家税务局能够检查、预防和处理避税和诈骗行为。

数据科学家是利用数据创造奇迹的巫师

在商业环境中,一个熟练的数据科学家善于将原始数据转化为有意义的见解,帮助公司使用数据来驱动决策。

例如,企业要进行采购决策。

那么企业需要对客户支付进行供应链分析。在企业的内部交易系统中有购买订单、发票和支付记录,数据库中还有供应商的详细信息等。数据科学家能够创建一个程序,它不仅可以显示订单频率和付款时间的趋势,还能通过建立预测模型,来为可能有类似商业行为的团体解读季节性趋势(即在特定时间段内相对稳定的起伏),通过对季节性趋势的解读,数据科学家可以预测消费者对库存商品的购买行为,并基于客户支付信息预测相关的采购预算。

但数据科学家不会就此止步,因为采购并不仅是季节性趋势这么简单。

除了通过企业内部资源获取营销数据,为了优化模型,他们还会利用网络数据爬取工具来获得一些常规的经济指标,如就业率和国内生产总值,以及一些特定的指标:如供应商的年度和季度报告、社交媒体的普遍情绪,甚至针对某一新闻事件进行监测。

他们从宏观到微观,通过建立模型,来获取任何可能影响消费者购买行为的数据,从而提供具有科学依据,富有说服力的商业建议。

03

 你适合申请 

 数据科学专业研究生吗? 


回答这个问题之前那,首先我们要弄清楚究竟哪些人适合申请数据科学硕士,以及数据科学教应具备哪些基本能力要求,同学们可以根据自己的情况进行评估,究竟你是否适合申请此专业的研究生。

哪些专业背景适合申请数据科学专业?

首先,本科是计算机科学(Computer Science)的同学,无异最符合大多数数据科学项目申请条件的,因为大多数数据工作都是通过编程和数据库的相关手段进行的,并要求学过统计、微积分、高级语言,如哈佛大学对于MSDS(Master of Science in Data Science)的本科背景要求是:希望有微积分、线性代数,概率和统计等相关课程,能使用至少1种编程语言,例如Python或R,了解计算机科学概念。

其次,本科背景是统计、数学或应用数学,且有一定编程基础的同学也可以申请,这都是很好的匹配专业。

最后,商科背景出身,但量化背景较强的商科专业,比如金工,但又希望能选择一个STEM(Science,Technology,Engineering,Mathematics)专业的同学,那数据科学专业显然也是个非常好的选择。

所以说,如果你有比较强的编程背景,又有比较好的数理基础,那你就很有竞争力;而纯商科背景的同学,如果没有强的量化背景、完全不懂编程,那么可以考虑数据科学(Data Science)和商业分析(Business Analytics)混合申请,因为后者相较数据科学更加偏商科,多开在商学院,对商科背景接纳程度大很多。

关于数据科学和商业分析、数据分析的区别我们在商业分析的文中已经详细说过,具体的同学们可以点击下方链接查看:
商业分析研究生申请完整指南,收藏!

数据科学家是什么人?

数据是冰冷的,只有专业人才能使数据有生命有价值

怎样才是数据科学领域的专业人才?什么是数据科学家?

Google首席经济学家、加州大学伯克利分校教授哈尔·范里安(HalVarian),在2008年10月与麦肯锡总监JamesManyika先生的对话中,曾经讲过下面一段话:

“我总是说,在未来10年里,最有意思的工作将是统计学家。人们都认为我在开玩笑。但是,过去谁能想到电脑工程师会成为20世纪90年代最有趣的工作?在未来10年里,获取数据——以便能理解它、处理它、从中提取价值、使其形象化、传送它——的能力将成为一种极其重要的技能,不仅在专业层面上是这样,而且在教育层面(包括对中小学生、高中生和大学生的教育)也是如此。由于如今我们已真正拥有实质上免费的和无所不在的数据,因此,与此互补的稀缺要素是理解这些数据并从中提取价值的能力。”

范里安教授在当初的对话中使用的是Statisticians(统计学家)一词,虽然当时他没有使用数据科学家这个词,但这里所指的,正是现在我们所讨论的数据科学家。

朝乐门在《数据科学理论与实践》中的定义为:

数据科学家是将现实问题映射或转换为数据问题之后,主要采用数据科学的理念、原则理论、方法、技术、工具,通过将数据尤其是大数据转换为知识和智慧的过程中,为解决"现实世界中的问题"提供直接指导、依据或参考的高级专家。


简单的概括,就是能用数据讲故事,能用数据解决问题的人。

数据科学家做什么?

有研究人员以Indeed、Linkedln和百度百聘为数据来源,搜集了2020年3月18至5月28期间,中国、美国、英国、德国、加拿大、日本、澳大利亚和韩国八个国家五种语言的数据科学家招聘公告,挑选出206则具有代表性的招聘公告,提炼出数据科学家的能力要求和岗位职责。

  • 这些职位的主要岗位职责包括:

(a)提出以数据为中心的解决方案;
(b)从海量数据中发现有价值的信息;
(c)面向具体业务的算法和模型研发;
(d)进行假设检验与试验设计;
(e)数据治理与数据质量控制;
(f)数据产品的研发及基于数据的传统产品的创新;
(g)跨部门和跨领域合作。

而具体的能力可以分为与数据科学相关的能力要求以及综合能力要求两类(如下图所示)


数据直接相关的包括计算机科学、数学、统计、数据挖掘、数据可视化、数据管理等等具体能力。

上述与数据非直接相关,但是是数据科学家所需要具备的素质,同时也是企业招聘中所非常看重的能力:包括团队工作中的沟通与合作能力、解决问题的能力、自学能力、细节导向型、抗压和应变能力、领导能力和数据科学家的3C精神。

所谓数据科学家的3C精神,包括解决问题的原创性(Creative)、思考问题的批判性(Critical)和提出问题的好奇性(Curious)。

部分招聘公告将数据科学家的3C精神称为"喜欢有挑战的工作",且特别提到上述三种精神的“天生"特点,强调应聘人才对数据问题的热爱和天生才华。

如Stanley Black & Decker公司要求数据科学家要有天生的好奇心以及对实证研究和解决问题的强烈热情;Loblaw Companies Limited要求数据科学家应具备精湛的分析和批判性思维能力。

这和托马斯和帕蒂尔在《哈佛商业评论》杂志上发表的《数据科学家:21世纪最性感的职业(Data Scientist: The Sexiest Job of the 21st Century)》文章中数据科学家应该具备的基本知识结构与综合能力高度匹配:他们沉浸在大数据中时能有价值发现,会编写程序代码,永远对数据充满好奇心,并且具备数据分析和交流沟通能力。

 The Data Science Venn Diagram by Drew Conway 

自我评估:你适合申请DS研究生吗?

总结一下,作为该专业的申请者,不妨反思一下,你是否符合这些特征:

(a)热爱数学,具有良好的数学、统计学基础
(b)敏锐的数据嗅觉,可以不仅可以数据视觉化更能数据“故事化”
(c)优秀的语言学习者,当然“计算机语言”也是其中一种
(d)充满好奇心,喜欢有挑战性的工作
(e)有能力把想法与其他人去交流 (不是用数学的语言介绍,而是用商业的语言给别人进行交流沟通)

如果答案是YES,那么恭喜你,你将会是潜在的优秀数据科学家。

而据统计,数据科学家一般都具有高学历——88%的数据科学家至少是硕士学位,46%的数据科学家是博士学位。

这表明想要成为一名数据科学家需要非常好的教育背景,那么取得此相关专业的硕士以上的学位将会是必须,接下来你只需静下心来,了解关于数据科学研究生硕士申请的更多信息,并做好相应的准备,稳扎稳打,朝着你的目标前行。

* 想要申请数据科学研究生硕士的同学,可以咨询我们专业的老师了解更多关于研究生硕士申请的信息。

04

 美国数据科学硕士 

 专业介绍 


在过去10年里,美国大学陆续开设200多个与数据科学有关的硕士专业。尤其是近几年,开设了数据科学、商业分析和数据分析专业的学校数量更是井喷(如下图所示):
我们可以看到2013年后,开设数据科学硕士项目的美国大学保持持续增长。目前TOP50院校中开设数据科学硕士专业的学校达21所。

* 我们整理了这21所院校的名单,有需要的同学可以通过下方自行领取。

扫码领取

备注“DS项目排名

领取TOP50开设数据科学研究生项目的美国院校名单完整版

下载文件


 美国的数据科学硕士专业一般开设在计算机学院、工程学院、数学、统计学院或者系下。设立在多个学院是因为这个专业本身属于交叉学科,包含了计算机,统计,数学,和应用领域的学科。

如果要说区别的话,计算机学院的培养方案当中,可以更多利用学校计算机的资源。

比如卡耐基梅隆大学的数据科学专业开设在计算机学院下,学生除了5个核心课程外,其余的课程可以在卡内基梅隆的计算机学院下开设的超过600门课中进行选修,当然项目对学生的计算机背景会有相对更为严格要求,卡内基梅隆的数据科学硕士要求其必须在项目开始前完成相应的计算机系统的课程,包括对往年录取学生的背景分析,具有更强计算机背景(包括本科专业,以及计算机实习或者项目经验)会更受招生官的青睐。

数学学院的培养方案,多从数学学科出发,更注重的数学方面的理论基础,因为院系的师资力量就决定了课程设置。

例如纽约大学的数据科学硕士(Master’s in Data Science)就是设立在纽约大学数据科学中心下(The Center for Data Science ,简称CDS),CDS附属在著名的库郎数学科学研究所 ,对申请者数学背景(本科数学科目GPA、GRE数学部分的成绩)较为看重,往年录取者GRE数学平均分在168分以上。

总的来说,数学给到大数据的理论性支撑会更多,而具体的大数据平台开发等,需要依赖于计算机语言去实现,比如说Java、Python等。

大家在进行院校和项目选择时可综合考虑院校的师资力量、课程设置、就业等等各方面因素去抉择。

数据科学课程设置

有研究人员针包括加州大学伯克利分校、纽约大学、卡内基美隆大学、哥伦比亚大学在内的授予数据科学硕士学位(Master of Science in Data Science)的18所高校的课程设置进行了研究,针对其课程设置,可以将其分为四类:

理论类,包括数学与统计学原理、数据科学概论、计算机科学概论等基础理论课程;

技术类,包括系统构建、数据计算,以及数据采集、存储、组织、检索、应用等过程所需的技术;

例如机器学习、数据库、数据挖掘和数据建模,旨在帮助学生掌握Python/Java/Pig/Hive等编程语言,提高学生应用分布式文件系统工具的能力,提高学生的数据分析能力。

③应用类,指数据科学的跨领域应用研究课程;

因为数据科学可用于各个行业,因此方向类课程也是每个学校的特色,例如哥伦比亚大学的MSDS有开金融量化大数据分析、可持续发展智慧城市大数据分析、生物信息大数据;斯坦佛大学开的数据驱动医疗课程,视觉识别神经网络、地理统计信息等都非常有趣。

④实践类,包括课程实验、专题研讨与实用技能培养相关的课程。

具体课程设置如下图:


调查的高校共开设必修课程202门,其中,理论类课程47门、技术类课程122门、应用类课程14门、实践类课程19门。可以看出美国数据科学硕士专业重视基础理论知识和学生技术能力的培养,其中,特别重视数学与统计学原理、机器学习、数据挖掘、数据分析、大数据相关课程。
 
而应用类及实践类课程在数据科学专业人才培养中具有重要作用。大多数高校要求学生在结业之前完成类似于国内的毕业设计、毕业实习的顶点项目(Capstone Project),学生以小组或个人的形式直接参与项目,待项目完结后上交项目报告并进行项目汇报。

如纽约大学要求学生对工业、政府机构、非政府机构或学术界存在的真实问题进行研究,学生需要参与项目的整个流程,从数据采集、数据处理、数据分析到提供解决方案。同时,学校为每个团队配备1名项目咨询老师,并且大部分的原始数据由项目赞助人(企业、机构等)提供。

05

 数据科学硕士 

 项目推荐 


我们精选了六个数据科学硕士项目,从Top10到Top50不同冲刺档次的院校,供在进行数据科学专业选校的同学参考。

目名称:Master of Science in Data Science

该项目是一个跨院系的交叉项目,由哥伦比亚大学研究生学院( Graduate School of Arts ),统计学系( Sciences’ Department of Statistics), 富的基金会工程与应用科学学院(Fu Foundation School of Engineering and Applied Science),应用科学计算机科学系( Applied Science’s Department of Computer Science )以及工业工程与运筹学系(Department of Industrial Engineering and Operations Research)共同开设,是集中了各个专业资源的顶级数据科学硕士项目。


哥伦比亚大学作为最早开设数据科学硕士项目的高校,该项目历史悠久且底蕴深厚,属于美国数据科学硕士申请难度的第一梯队。该项目为期一年半,共需修读30个学分,无需撰写毕业论文,属于就业导向型项目。
 
核心课程主要分为两个部分,分别是计算机科学(CS)和统计,其中CS方面授课的主要内容是算法还有并行计算系统,而统计的部分主要学习的是机器学习和统计推断的内容。该项目在选修课方面十分自由,学生只要得到了学术指导老师的批准可以选修任何其他专业的课程。
 
哥伦比亚大学的数据科学项目要求申请者拥有一定的数学及编程基础,最好学过微积分、线性代数、计算机编程等课程,没有强制性的工作经验要求。学生有机会在研究生阶段进行原始研究,项目包含一个顶点项目,在其中与校方的行业合作伙伴和教师互动。

项目名称:MSE in Data Science

数据科学硕士(Master of Science in Engineering in Data Science )项目简称为DATS,开设于宾夕法尼亚大学工程学院下。和哥大、纽大的数据科学同属于美国数据科学硕士申请难度的第一梯队。

项目时长为1年半到2年,平均一届在30-40人左右,中国学生大约占比1/3至1/2,DATS项目要求学生上满10节课,其中至少5节选修课程,选课灵活度很大,学生可根据自己的兴趣和对未来职业的规划安排课程。

项目的一大亮点是,学生可以在第二年选择等同于两门课的论文或实习课(Thesis/Practicum)。如果研究项目偏理论,将被定义为论文(thesis),如果偏实际应用,将被定义为实习课(practicum),学生可选择自己的项目导师,并在学期结束展示自己的研究结果,这对于在入学时不确定自己未来的发展方向的同学非常友好,你可以随着学期的推进决定未来是走研究方向还是就业。

宾大还有不少提供给数据科学专业学生的资源,如宾夕法尼亚大学数据科学小组(Penn Data Science Group)会定期开设各种编程语言的课程,并且每学期都有3-4个与校外公司合作的项目让学生组队参与,同时也有参加各类Kaggle竞赛的队伍。除此之外,沃顿商学院的Wharton Research Data Services(WRDS)会定期招募数据科学专业的学生做兼职工作,学生在学习之余有机会参与到研究项目中。

同时每年两次的工程学院招聘会,会来各大科技公司和金融公司,而宾大是众多金融和科技公司的Target School(目标学校),公司会来学校举办招聘讲座,学生有机会和资深业内人士进行面对面交流(Networking)。

项目名称:MSS focus on Data Science and Analytics


杜克的统计学硕士(Master’s in Statistical Science)属于三一文理学院(Trinity College of Arts & Sciences),专业开设在统计学系(Department of Statistical Science)下,从入学到毕业需要两年时间。针对研究生,原本是有两个学位可选的,第一种是统计学硕士(Master’s in Statistical Science),第二种是统计学与经济学建模硕士(MS in Statistical and Economic Modeling),但从2017-2018年MSEM开始已经停止接受新生了。所以现在可以申请的就只有统计学硕士(Master’s in Statistical Science)这一种。


MSS侧重于教学生统计学方法和理论教学,要求学生是要取得36个学分以及提交论文才可以毕业。课程和项目强调基于随机模型的推理和预测问题的方法,强调贝叶斯和机器学习方法。学生可以发展复杂和潜在的大量数据集的建模技能和专业知识,以及先进的计算方法,同时获得广泛的应用背景。


相较其他数据科学项目的强就业导向,此项目较为“学术”,学生既可以选择直接就业从事医疗健康、经济金融、市场调研、商业分析及社会科学领域工作;也可以选择继续在统计和相关领域进行博士深造。如果你未来有意在此领域进行更高学位的学习,杜克大学的MSS项目是一个不错的选择。


项目名称:M.S. in Data Science


弗吉尼亚大学的数据科学硕士(Master of Science in Data Science,MSDS),设置于弗吉尼亚大学的数据科学学院(School of Data Science)。弗吉尼亚大学的数据科学学院是全美第一所数据科学院,成立于2019年秋季。项目时长是11个月,学生可以根据自己的需要延长项目的时间。
 
项目的亮点是学生在研究生期间需要做一个长度半年多的项目,以及提交论文,这也和其他大学的数据科学(DS)项目有比较大的差别,因为大部分的DS项目的学生在毕业之前是不需要写论文的。

虽然如此,但是该项目依旧是一个以就业为导向的项目,因为论文的内容更像是项目报告而非学术论文。论文要做的项目有很多选择,比如和学校管理部门合作,做能源趋势预测(Energy Trend Prediction),做外部企业例如德勤和诺斯罗普格鲁曼公司(Deloitte、Northrop Grumman)的项目,选择什么完全看学生自身的兴趣和需要,自由度比较大。
 
弗吉尼亚大学的数据科学项目是此专业的“老网红”了,校友资源丰富,他们广布亚马逊、中央情报局、谷歌、MITRE、摩根斯坦利、美国国立卫生研究院、麦肯锡,德勤等知名大厂和机构,项目毕业生的就业率几乎为100%。

项目名称:Master of Science in Data Science (申请难度较大


纽约大学的数据科学专业设立在Center of Data Science(CDS)下面(CDS附属在著名的库郎数学科学研究所 Courant Institute of Mathematical Sciences ,应用数学专排第一),是世界上第一个专门为数据科学开设的硕士项目。

虽然纽大的综合排名在30名,但是数据科学项目硕士项目课程设置很成熟,项目强大的师资力量和学术资源,无论是教育质量和业界口碑都很不错,申请和录取难度甚至甚于哥大MSDS项目。

纽约大学的数据科学项目需要完成36个学分,一般来说需要2年的时间毕业。有6门专业必修科目,6门选修课程。学生可以从数据科学中心选择,也可以从非数据科学中心去选择课程。数据科学学院(CDS)的选课是极度自由的(计算机科学, Stern 商学院的课基本上都可以选)。

纽约大学数据科学项目通过几年的摸索,已经形成了自己的一套完整的体系。

(a)必修第一学期主要是数据科学入门和统计课,数据科学入门给学生一个对于机器学习总体的感受。上课留的作业是日后处理公司面试案例教学的神器,只要按照课程认真完成作业,受益匪浅;统计课也是神课,虽然据学生反馈作业巨难,但是真的是货真价实的统计课程。

(b)第二学期必修有机器学习和大数据, 机器学习这门课的老师是Bloomberg 首席技术官,非常敬业,作业也超级多。连很多美本的同学都表示是他们来美国以来老师教的最好的一门课。大数据这门课中会学一些Hadoop, Spark等等大数据工具。CDS的选修课还有Yann Lecun大牛的深度学习(Deep Learning) 和未来大牛Cho老师的自然语言处理(NLP),都是很值得期待的。

总之,项目的每个学生都可以通过选课来决定自己的发展方向,无论是想研究深度学习, 自然语言处理还是金融,总有一款适合你。

项目名称:Master's in Data Science


东北大学数据科学理学硕士项目是由计算机与信息科学学院和电子与计算机工程系共同开设的跨学科项目,为2016年新增项目。该项目主要面对有数据和计算机基础的学生,帮助学生深度理解计算建模、数据收集与集成、数据存储与检索、数据处理、建模与分析以及可视化的专业知识。
 
项目要求完成32个学分。GPA需要达到3.0+/4.0才能拿到硕士学位。项目包含5门核心课程,主要为介绍数据科学的基础技术,包括算法、数据处理、机器学习、数据挖掘等以及Capstone课程(相当于毕业项目)。

东北大学计算机相关专业的带薪实习(CO-OP)很给力,基本想找工作的学生全部都有带薪实习,实习的公司有BCG,Spotify,ebay等。项目不仅能够帮助学生在快速发展的领域内获得数据科学家与数据工程师的职位,也能帮助学生加快取得相关博士学位。

* 我们整理了上述项目所有不同分支方向的课程设置、录取要求、文书和面试题目一,有需要的同学可以通过下方自行领取。

扫码领取

备注“DS项目介绍”

领取项目介绍完整版

下载文件


06

 数据科学 

 申请案例分享 


在进行申请准备前,我们不妨先看看往年的录取数据,下面是ALPHA过往成功录取TOP30数据科学硕士项目的学生具体数据:


(a)首先现明确一点,在进行数据科学研究生申请中起关键作用的是本科专业 、GPA、 GRE、  实习和科研这几块。可以这样简单地理解:本科专业决定了学生的学术背景是否匹配,GPA和GRE则提现了学生的学术水平,最后实习和科研能一定程度表现学生领域的热情和技能熟练度,科研也能一定程度上表现学生的学术热情以及潜力,对于研究型的项目申请具有更大的优势;

(b)回到上述案例,这些数据科学头部学校录取者基本以数学和计算机相关背景为主,和我们之前说的所说相符,数据科学具有竞争力的背景最好本科为计算机专业,或者纯数学、统计专业但具有一定计算机的课程和项目基础;

(c)从案例中申请者的GPA、GRE和托福成绩来看,哥大数据科学和南加州大学的数据科学专业差不多属于同一梯队的,申请难度偏相对较小(相对纽大、宾大来说),GPA3.3+即能够满足学术上的入门申请要求, 配合320+的GRE成绩,硬件条件基本够了,其余的就看申请者的软背景实力了,这些成功的申请通常有2段以上的量化相关的实习或者科研经验;

(d)纽大的数据科学专业和宾大的数据科学专业差不多属于同一梯队,申请难度较大,GPA 3.8+,GRE 325+才算有竞争力的硬件背景,当然要想取得这两所学校的录取,软件背景也不能弱。

* 有意向申请数据科学的同学,可以参考上面表格中的数据,理性定位,当然你也可以咨询我们专业的老师帮助你进行申请的选校规划。


07

 数据科学 

 申请建议 


关于数据科学研究生的申请,我们将分为两个部分,客观评价标准以及非客观评价标准。

客观评价标准:可量化的硬性条件

本科背景

申请数据科学硕士的本科背景:数学、统计或计算机科学相关最佳;物理、经济学等强调数学能力的专业次之;其他理工专业再次之。

当然,如果不是相关专业,但有丰富的相关领域工作或科研经历,尤其是体现量化(Quantitative)和编程(Programming)能力的申请者也可以。

本科课程建议

(a)数学课程

尽管每所学校都要求不尽相同, 但一般会要求学生修过线性代数,概率论,数理统计,微积分等这些基础课程;或者高级物理学,工程学或有大量数学内容的计量经济学课程作为数理能力的补充

(b)计算机课程

计算机科学入门(或等效的“ CS-101”编程课程),如果有其他计算机基础课程如算法,数据结构,数据库概率,数据挖掘,机器学习等更佳;

(c)计算机编程

计算机语言没有特定的要求,但是成功的申请者通常至少需要掌握一门编程语言,编程语言(Python/R/Java/C++),一般最看重Python和R
 
由于本身数据科学是一门跨领域的学科,所以对先修课的要求要多一些,核心就在于在数学、统计和计算机的课程上,如果你尚未毕业,可以根据自己的情况调整自己的本科修习的课程,以尽可能满足数据科学申请的本科学术背景的要求。

关于GPA和标化成绩

关于GPA和标化成绩,这里我们把学校分三个档次分别来看:一档 US NEWS排名前10的学校;二档US NEWS 排名前30的学校;三档US NEWS 排名前50的学校。

!

以上只是建议的GPA和标化分数,并不绝对,仅供参考。


非客观评价标准:软背景实力如何提高?


数据科学申请几乎不存在面试,除了文书之外最重要的就是数据或者计算机方向的经验,经验包括实习经验以及科研经验,下面我们将分两个部分讲解。

科研经验

在大学期间最好找和量化相关的科研,通常可以在学校网站上找到相关实验室(Lab)的联络人,发邮件咨询是否能提供研究助理的机会。例如ALPHA学员就在学校的官网上找到与音乐推荐相关的科研项目。
 
如果学校没有,一些公司现在也提供相对应的科研,对口的科研有数据挖掘中的算法和应用,亦或者计算机软件、数据库相关的项目。如果从学校和公司都找不到对口的科研,也可以把完成度和关联度较高的课程大作业拿来使用。如果没有科研经历,对于想冲刺名校的学生来说,将是极大的硬伤。
 
实习经验

最后就是实习。一般来说在申请之前最好拥有2-3段的相关实习经历。在选择实习的时候,遵循岗位优先的原则,先选择和申请专业符合的岗位,再来考虑公司的知名度。不要因为想要让自己的简历看起来高大上或者因为有大公司推荐信而盲目选择没有帮助的实习机会。
 
实习最优选择应该是数据公司的数据岗,比如数据科学家,数据分析师,机器学习工程师,研究分析师等,然而现实是这些岗位由于太过重要,实习的机会较少。所以建议找一些统计、量化相关的或者计算机相关的实习,比如统计师,产品分析师,生物统计师,分析师助理,大数据处理助理。

【如何找实习资源】

(a)美本学生可以在学校Handshake等校内的求职平台,会有当地的或者和学校合作公司的实习资源提供,这也是大部分美本学生可以好好利用的,在美国公司的实习机会;也可以在Indeed等美国求职网站搜索“intern”岗位看看是否有合适实习岗位;

(b)当然也可以选择假期回国,在国内企业进行实习,那么你可以选择在实习僧、智联招聘、BOSS直聘等网站,或者感兴趣的企业的公众号、网站搜索适合的岗位进行简历投递。国内的同学除了在上述求职平台,不妨利用好国内的校内论坛,经常会有企业或者往届师兄师姐在学校论坛内分享一些实习岗位。

除了科研和实习外,可以参加一些数据相关的竞赛,竞赛的平台有很多,比如最近很火的Kaggle,再如阿里的天池、SODA、WID、数据嗨客等。

!

提醒各位同学一定要提前规划自己的时间,量力而行,千万不要因耗费大量时间和精力在软背景的补充上反而忽视了GPA,特别是量化课程成绩,顾此失彼。


08

 写在 

 最后 


在全世界任何一个国家的教育体系中,地位最高的永远是2门课程:其一是语言,其二必是数学。语言是表达的工具,数字是精准的智慧。无论文化差异多大,却在各个国家保持着惊人的统一。而大部分现代科学走向成熟的进步历程,都经历过从早期单纯的定性分析,走向依靠数据进行精准定量分析的历程。
 
从这两点管中窥豹,似乎不难解释,为何数据在高速前行的今天,变得越来越重要,以及数据科学专业的热度居高不下。由于篇幅有限可能有些细节未能来得及悉数道来,你可以咨询我们的专家老师,或者看看你的问题是否有覆盖在下述常见问题库中。
 
我们总结了ALPHA学生在申请过程常问的问题,并进行了解读,望能有所帮助。

【部分常见问题预览】

1.老师,请问申请数据科学专业,对申请者的背景有什么要求吗?
2.数据科学和数据分析这两个专业有什么区别吗?
3.我本科CS专业的,现在CS专业申请的竞争很激烈,我能同时申请数据分析和数据科学专业吗?实习和科研有什么推荐吗?
4.老师,卡内基美隆大学的计算机专业全美排名第一,他家的数据科学专业怎么样?难不难申请?
5.申请数据科学专业,对申请者的背景哪些要求?
6.想申请数据科学硕士,但目前的专业没有计算机语言课程,该如何弥补?
7.数据科学研究生毕业后有什么职位可以选择

* 同学可以通过下方,回复关键词“DS常见问题”向老师领取Q&A完整版。

扫码领取


备注“DS常见问题”

领取DS研究生申常见问题及答案完整版

下载文件


申请本身就是一场信息竞赛,是一个不断提高认知能力和知识储备的过程,ALPHA喜欢且享受和学员共同成长的过程,我们希望通过我们的努力减少大家研究生申请当中的信息不对称现象,和因为这种不对称信息造成的决策错误,帮助大家少走弯路,抓住更多的发展机会——这也是整个专业百科全书发起的初衷。
 
今天关于数据科学的分享就到这里,我们下一期再见。

- end -

往期推荐 ·
《金融学研究生申请完整指南》
《市场营销研究生申请完整指南》
《计算机科学研究生申请完整指南》
《商业分析研究生申请完整指南》
《数据科学研究生申请完整指南》
《生物统计研究生申请完整指南》
《生物信息学研究生申请完整指南》
《生物医学工程研究生申请完整指南》
《经济学研究生申请完整指南》
《心理学研究生申请完整指南》

正文引用来源
1、领英2021年中国新兴职位趋势报告 [EB/OL],2021
2、Glassdoor Best jobs in America [EB/OL].https://www.cnbc.com/2020/01/15/the-20-best-jobs-in-america-in-2020-according-to-glassdoor-ranking.html,2020
3、朝乐门,肖纪文,王解东.数据科学家:岗位职责、能力要求与人才培养[J].中国图书馆学报,2021,47(03):100-112.
4、The Data Science Venn Diagram by Drew Conway [EB/OL].http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram,2013
5、曹高辉,胡紫祎,郭家乐,王艳凤.美国数据科学硕士专业培养要求与课程设置研究[J].数字图书馆论坛,2018(05):38-45.

- end -

戳这里关注我们👇,留学路上一起成长

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
英美本科专业选校看这里!2023年英国高薪专业排行榜出炉!【研究生申请】无GRE转专业,TA如何斩获全美Top10商学院的商业分析offer?24Fall申请必看!美国大学TOP10院校研究生申请条件汇总!行止,女,中国社会科学院大学研究生,在编教师,月入1万+,96年,高160,广州海珠心理学研究生申请:一场比COVID更严重的健康危机正席卷而来人类已进入大数据时代, 这个职业潜力无限! 西澳大学数据科学硕士详解应应景:父亲节快乐突破研究生招生难关——高效撰写研究生文书市场营销研究生申请:大数据时代对消费领域的彻底入侵揭晓了!2023年英国高薪专业排行榜出炉!英美本科专业选校看这里!985大学研究生报考事业单位遭拒,只因专业名字太生僻?专业选择,如何平衡理性与热爱?24Fall必收藏!美国顶级大学TOP30研究生申请要求全揭秘!专业选择需谨慎!盘点未来十年容易被AI取代的职业,这几类专业“永不过时”!金融学研究生申请:AI冲击下的金融求生策略春招上岸 | 芝大应用数据科学研一学员斩获Wish实习!《相思引 - 父亲节纪念父亲》AI时代的美国大学申请: 学子们如何保持不被取代的竞争力?30%医学研究生为了出更好的研究成果,竟认为编造一些实验数据是合理的!专业选择是否影响录取?哪些专业更容易被美国大学录取?我的专业选错了么?先看看这些消失的职业【研究生申请】被Top10名校录取?“学业+实习”缺一不可!超专业化时代的困境: 跨学科研究如何消弭专业壁垒?当留学生开始“卷”考公,专业选择要更加慎重!求职干货|TikTok 2024 秋招已开!海外求职:数据(数据分析、数据科学、工程)​溜着看,看着扯最“性感”的职业,大数据时代下爆火的数据科学!行业薪资,就业前景,专业申请大揭秘最全!美国研究生申请要求及时间规划方案数学专业就业选择有哪些方向?同学们简历投递方向有哪些?求职干货 | 京东 2024秋招已开启!海归求职:数据(数据分析、数据科学、工程)求职干货|Apple 2023 全职岗已开!海外求职:数据(数据分析、数据科学、工程)​六十六 中秋六十五 秋收求职干货 | 字节跳动 2024秋招已开启!海归求职:数据(数据分析、数据科学、工程)哥大、南加大排名Top级专业揭秘!市场营销研究生申请攻略来袭
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。