深度好文|华为盘古大模型全布局揭秘,惊为天人!
Offer帮官网:offerbang.io
开天辟地!石破天惊!
属于中国的“盘古”天神3.0
它来了!
在7月7日举办的华为开发者大会2023(Cloud)上,华为云正式发布盘古大模型3.0。不疾不徐,华为盘古大模型揭开了新的一重面纱,也是ChatGPT热潮之后,华为首次系统性地谈论大模型。
“到了整个市场都重视大模型落地、谈论行业大模型的时候,华为就必须要站出来了”。
虽然早在2021年4月,盘古大模型1.0就已经发布,早于今天大部分的大模型。但是,当ChatGPT掀起的大模型热席卷全球时,与百度、阿里等大厂相比,华为的声量要小的多。
现在,华为常务董事、华为云CEO张平安明确喊出了盘古大模型的价值观:“不作诗,只做事。”
揭秘:盘古大模型3.0成熟体
盘古大模型3.0是一个完全面向行业的大模型系列包括5+N+X的三级体系。
三级体系是华为在2022年4月提出的概念,即基础大模型L0、行业大模型L1,以及场景大模型L2。三者层层递进,从通用能力逐渐向各个垂直领域演进,由此“重塑行业”,支撑起华为“AI for Industries”的宏大目标。
L0层包括自然语言、视觉、多模态、预测、科学计算5大基础模型,提供满足行业场景的多种技能。
L1层是N个行业大模型。盘古大模型首要的就是要为行业客户提供行业大模型能力。例如政务大模型,金融大模型,矿山大模型等,能够基于基础大模型的多种能力组合,通过行业数据以及企业自有数据的二次训练,帮助企业打造自己的大模型。
L2层为客户提供了更多细化场景的模型,更加专注于某个具体的应用场景或特定业务,为客户提供“开箱即用”的,模型服务。与基础大模型和行业大模型相比,场景模型更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务,例如,在医疗领域,针对小分子筛选,小分子优化等。
在AI大模型时代的背景下,面临自下而上自主创新的宏大命题,华为正在用“盘古”大模型正在打造世界AI另一极。
解秘:华为云的“特战部队”
2020年3月,华为诺亚方舟实验室计算机视觉首席科学家田奇,在内部转岗至华为云团队,担任人工智能领域首席科学家。他是后来的盘古大模型团队的负责人。
田奇是计算机视觉领域的专家。他本科毕业于清华大学电子工程系,硕士毕业于美国德雷塞尔大学,后赴美国伊利诺伊大学香槟分校学习,师从Thomas S. Huang教授,并获得博士学位。在2002年至2019年期间,历任美国德克萨斯大学圣安东尼奥分校计算机系助理教授、副教授、正教授。
2018年,田奇做出了一个改变人生轨迹的决定,离开学术界,加入华为。就在田奇加入华为云的这个夏天,OpenAI发布了GPT-3,谷歌、Meta等国际巨头已经围绕预训练大模型展开激烈竞争,而在国内,预训练大模型的发展还极为有限。根据IDC《2022中国大模型发展白皮书》的数据,2020年之前,中国大模型的数量只有2个。
当时的华为云已经把AI作为重要赛道。2021年时,该团队包含20多名博士、30多名工程师、3名广受关注的“华为天才少年”,还有50多名来自全国C9高校的专家。
田奇希望给盘古大模型找到差异化突破口。华为云盘古大模型没有局限在NLP领域,而是从CV着手,与NLP并行,二者结合语言、图像,搞多模态。同时,还特别看重华为一向非常重视的科学计算。
2020年11月,盘古大模型在华为云内部立项成功。为了尽快追赶上国际水平,田奇将这个团队称之为“特战队员”,田奇为了克服时间、数据、算力资源等等难题,团队采取广泛合作的对策。
例如数据方面,他们找到了气象局等合作伙伴;资源、算力方面,又寻求与鹏城实验室进行合作。成员本身也需要随时调整身份做其他工作,比如CV专家可能也会去参与NLP和多模态大模型的开发,甚至他的CV知识都会灵活运用到其它领域中。在后期,这些技术专家们还需要更长远地去考虑商业化模式方面的问题。
在奋战6个月之后,华为云盘古大模型终于面世,并在接下来的两年中进行了两次大版本的迭代,直到今天盘古大模型3.0的发布。华为云提前种下的种子,已经比多数同行更早结出了果实。
探秘:互联网数据科学家的养成
当普罗大众还在沉浸ChatGPT聊天的惊艳表现时,人工智能厂商已经在设想大模型的商业化。
伴随着国际上,微软、亚马逊等大厂向企业级服务寻求商业化路径,进行多个行业的探索;国内,诸如华为、百度、阿里、腾讯等大小厂商,都在快马加鞭加速行业大模型投入,数据科学家的人才需求,正在疯狂膨胀。
那数据科学家们应当具备哪些技能和能力?
✅学历:想要成为一名数据科学家需要非常好的教育背景——88%的数据科学家至少是硕士学位,46%的数据科学家是博士学位。常见的专业是计算机科学、社会科学、物理科学和统计学。最常见的研究领域是数学和统计(32%),其次是计算机科学(19%)和工程应用(16%)。
✅R编程语言:对于数据科学家而言,R语言通常是首选编程语言。R语言是专门为数据科学需求而设计的,可以使用R语言来解决在数据科学中遇到的任何问题。事实上,43%的数据科学家正在使用R语言来解决统计问题。
✅Python编程:随着人工智能以及深度学习的发展,Python已经超越Java语言成为编程中最常用的语言。由于Python的多功能性,可以将其用于所有涉及数据科学过程的步骤。
✅SQL数据库/编程:作为一名数据科学家,需要精通SQL。这是因为SQL专门设计用于访问、通信和处理数据。由于其简洁的命令,可以节省时间并减少执行困难查询时所需的编程量。
✅Apache Spark:Apache Spark正成为全球最受欢迎的大数据技术。Apache Spark专为数据科学而设计,能更快地运行复杂的算法。
✅机器学习和人工智能:想从数据科学家中脱颖而出的话,需要了解机器学习技术,如监督学习、决策树、逻辑回归等,这些技术将帮助你解决基于已有的数据和结果来预测不同数据科学问题。
✅数据可视化:作为一名数据科学家,必须能够借助数据可视化工具(如Ggplot、D3.js和Matplottlib以及Tableau)来可视化数据,这些工具能将项目的复杂结果转换为易于理解的格式。
✅非结构化数据:由于非结构化数据(视频、音频、文章等)的复杂性,大多数人将非结构化数据称为“黑暗分析(dark analytics)”。使用非结构化数据有助于揭示对决策制定有用的见解。作为数据科学家,必须有能力理解和操纵非结构化数据。
当然除了上面的专业技能以外,保持永无止境的好奇心、敏感的商业头脑以及强大的沟通能力和团队协作能力,同样是是数据科学家成功的关键要素。
如果你想更深入的了解数据科学,更好的获取Offer,想进行系统地知识点学习,或者想练习更多面试实战训练,可以扫描下方👇课程链接了解课程详情或者直接添加🔍金牌顾问 免费试听或咨询优惠。
课程顾问
课程顾问|Dianna
免费试听|咨询课程优惠
我们的学员们已成功斩获金融、咨询、数据等多个领域的Offer。能展示出的Offer只是冰山一角,这一份份实打实、沉甸甸的Offer,让我们团队的每一个人都倍感自豪。在未来的道路上,Offer帮会继续脚踏实地,用专业、诚信、用心的原则,助力所有学员的求职之路!
微信扫码关注该文公众号作者