再说一遍!不要再把数据科学和人工智能混为一谈了!
Offer帮官网:offerbang.io
未来已来
AI、ML、DS
别再傻傻分不清楚!
自从去年年底Chatgpt发布以后,数据科学(DS)、机器学习(ML)和人工智能(AI)这样的词语出现在各种重大新闻和会议中的频率变得比之前更加频繁。但有趣的是,由于这些领域存在很多重叠的部分,造成许多人把他们混为一谈,今天带大家一起揭开它们到底哪里不同?
一句话总结来说:数据科学涵盖人工智能,包括机器学习。
机器学习是连接数据科学和人工智能的纽带。这是因为机器学习是从数据中不断学习的过程。因此,AI是帮助数据科学获得结果和解决用于特定问题的方案的工具。
为方便小伙伴们理解,这里对这三个领域进行简单的定义:
数据科学产生洞察
机器学习产生预测
人工智能产生行动
数据科学产生洞察
数据科学不同于其他两个领域,它的目标是站在人类视角的,它关注人如何获得对事物的洞察和理解。
数据科学的定义强调下面几点:统计推断、数据可视化、实验设计、领域知识、通讯。数据科学家为了更好地理解数据,会使用工具来分析数万亿条记录,研究和开发基于统计分析的系统并实现数据可视化。
数据科学家必备技能:
Python或R
Jupyter Notebook
TensorFlow
统计
NLP (自然语言处理)
SQL
Tableau或其他可视化工具
有信心在管理者面前演讲你的发现
和非分析/非技术专家沟通高级分析的能力(Advanced analytic)
也可以根据职能将数据科学家分为以下几种类型:数据架构师、数据工程师、统计学家、业务分析师、A型(分析)与B型(构建)数据科学家。
机器学习产生预测
机器学习其实是人工智能和数据科学都很重要的一部分,因为目前,在实践过程中,大多数的人工智能处理的任务,其实是用机器学习的方式完成的。机器学习可以用程序和算法自动地学习,并且进行自我优化。同时,机器学习需要一定数量的训练数据集(Training data set),用于构建来自过往经验的“知识” 。
机器学习领域知名学者Tom M.Mitchell曾给机器学习做如下定义:如果计算机程序针对某类任务T的性能(用P来衡量)能通过经验E来自我改善,则认为关于T和P,程序对E进行了学习。
根据是否在人类的监督下进行学习这个问题,机器学习任务可以划分为:监督学习、半监督学习、无监督学习和强化学习。机器学习是人工智能的一个分支,也是人工智能的一种实现方法。
数据科学和机器学习之间也有很多重叠。例如,逻辑回归可以用来获取有关相关性的洞察(如“用户越有钱,他们购买产品的可能性越大,因此我们应该改变我们的营销策略”)并做出预测(如“这个用户有53%概率购买我们的产品的机会,所以我们应该向他们建议“)。
由此我们可以这样区分:数据科学产生可解释的模型,而机器学习的模型更多是“黑盒子”,或者说是不可解释的。大多数从业者会可以在数据科学和机器学习之间平滑切换。
人工智能产生行动
人工智能(AI)可能是一个比数据科学更热门的话题,可以用于各行各业。人工智能定义有很多,有一个共同点就是:它可以自动代替人执行动作或给出推荐的动作。重点研究新的算法,利用现有神经网络,在大型数据集上,部署并自动化整个流程和人工智能解决方案。
定义AI的一些系统包括:棋类算法(Deep Blue,AlphaGo)、机器人控制理论(运动规划,行走双足机器人)、优化(Google地图选择路线)、自然语言处理、强化学习等。
跟数据科学家一样,人工智能工程师也要去研究一个问题,获取数据,然后找到算法的解决方案。但是,人工智能工程师还有一些额外的工作,比如提出新算法、执行建模等等。他们工作的重点,是在应用程序中部署这些模型,比如神经网络和深度学习实践等。这些差异也意味着这两个角色会用到不同的Libraries。比如,数据科学家可能倾向于使用sklearn,而人工智能工程师可能更多地使用TensorFlow和PyTorch。
人工智能工程师必备技能:
Java, Python, 或 C++
AI 系统
使用TensorFlow,PyTorch进行深度学习
与研究团队和工程团队合作
认知硬件要求
部署生产模型
计算机科学(Computer Science)
架构或交付云解决方案
Spark
Scala
与数据科学不同,这些技能更侧重于软件工程,以研究与部署为中心。比如,人工智能工程师可以频繁地研究深度学习和神经网络算法,而不是不用回归分析和决策树。与数据科学的另一个区别是,人工智能工程师往往要求博士学位,而数据科学家通常需要硕士学位。
总结
最后我们用自动驾驶汽车案例来说明这三个领域的区别。
机器学习:汽车必须使用摄像头识别停车标识。我们构建了包含数百万街头物体照片的数据集,并对算法进行了训练,以预测哪些物体中有停止标识。
人工智能:一旦我们的汽车可以识别停车标识,它需要决定何时采取刹车措施。过早或过晚都很危险,我们需根据道路条件(例如在湿滑的道路上)进行判断,这是一个控制论问题。
数据科学:在实际测试中,我们发现汽车的表现不够好,在日出之前或日落之后光线影响了它停车标志的判断。所以我们在训练数据中新增构建了包含夜间图像的数据集并重复机器学习步骤。
再结合从数据科学家和人工智能工程师总的岗位描述和申请经验来看,虽然两个职位之间是有很多相似之处,但人工智能工程师比数据科学家要求更复杂:
数据科学家:Python,R,统计知识,可视化工具,适合节奏更快,更简单的案例;
人工智能工程师:软件工程,深度学习,自动化,偏向研究,适合节奏较慢,更复杂的应用案例;
如果你也想了解更多资讯,探索更多数据科学领域的相关知识,选择更好的职业领域,更好的获取Offer,或者想练习更多面试实战训练,可以扫描下方👇课程链接了解课程详情或者直接添加🔍金牌顾问 免费试听或咨询优惠。
《数据科学·机器学习求职实战营》
FLAG、咨询、投行大牛导师团队带你求职数据科学
数据科学 / 机器学习 / 数据分析 / 商业分析等领域
本课程由科技大厂、咨询公司、投行一线数据科学家教研组用心研发,针对数据科学/机器学习/数据分析/商业分析等行业岗位要求,以知识学习和求职为导向,从编程技巧、模型理解、实战项目3部分全方位提升你的数据分析综合能力。
课程通过详细教授核心技能,导师手把手做实战项目,面试真题实训,帮助你高效学习求职必备Technical,提升简历,强化面试技巧。
Offer帮
Offer帮金牌顾问// James
🔎扫码了解课程详情
🔓免费试听,解锁更多优惠
名企导师天团,深度互动答疑
课程由国内外知名大厂数据行业导师天团倾力研发,结合当下数据分析岗位需求、面试知识点及热点,力求帮助学生深入浅出,一站式提升简历、面试、行业知识及技能。
华尔街量化对冲基金分析师Kevin
FLAG数据分析师 Chris
互联网资深数据科学家 Callie
BAT数据分析师 Deniel
MBB数据分析师Tong
纽约对冲基金量化组Jon
名企数据科学家
另外,我们还安排了相应的导师Office Hour在线答疑,确保同学们可以有更多时间和导师深度互动,绝不把问题留到明天!!!
实操工业级实战项目,掌握核心必备技能
区别于学校和市场上单纯的技能培训,《Offer帮求职核心课程》名企导师手把手带你做“可以写进简历的实战项目”:知名企业的真实项目数据,有效提高简历含金量,增加通过初筛概率!
同时,课程会详细讲解数据求职时所会遇到的各种问题,及应对技巧,让同学对求职整个过程有更清晰的目标和规划。
创新学习平台,一站式满足所有求职需求
课程采用录播+直播相结合的方式,课程有效期内#免费无限次课程回放,帮助你补课或者反复复习,满足你的时间弹性和多次学习需要。
📖课程大纲📖
简历精修+模拟面试+大厂内推
#求职资料实时更新,保姆式为你的求职之路保驾护航。更有创新自主学习平台,一站式管理学习资料&课程进度;#数据专属交流群,结识志同道合的求职伙伴,扩大职场社交圈!
√ 15周86课时的课程时长
√每周OH直播答疑 + 实时更新职位列表
√ 免费的1v1简历精修和模拟面试
√名企内推机会
学员上了都大呼
太合算!!!
该课程已经帮助数千学生顺利进入麦肯锡、亚马逊、摩根大通、谷歌、BCG等各行业的顶级头部公司,并收获无数五星好评🌟。感兴趣的同学请尽快抢位报名!小班教学,报完即止!
Offer帮
Offer帮金牌顾问// James
🔎扫码了解课程详情
🔓免费试听,解锁更多优惠
近期学员Offer榜
金融、咨询、数据等多个领域的Offer展示
能展示出的Offer只是冰山一角,这一份份实打实、沉甸甸的Offer,让我们团队的每一个人都倍感自豪。在未来的道路上,Offer帮会继续脚踏实地,用专业、诚信、用心的原则,助力所有学员的求职之路!
(点击图片即可查看大图)
微信扫码关注该文公众号作者