做好生成式AI普惠化的“摆渡人”
从2022年底开始,由ChatGPT引发的生成式AI热潮仍在持续升温。最近几个月内,国内类似的产品不断涌现,调高了人们的胃口。随着新的技术、新的应用模式出现,“AI普惠化”这个话题再度引发强烈关注。作为云服务商,亚马逊云科技一直以来的定位就十分清晰——以创新的技术、服务和生态,推动生成式AI技术的普惠化。
推动生成式AI普惠的“四驾马车”
人工智能的应用已经经历了几十年的发展。亚马逊云科技致力于应用人工智能技术为自身业务的发展,以及各行各业、不同规模的客户赋能。在人工智能、机器学习和堆栈这三个层级,亚马逊云科技拥有非常丰富和多样化的产品组合。
亚马逊云科技大中华区产品部总经理陈晓建
近日,亚马逊云科技大中华区产品部总经理陈晓建面向中国媒体正式宣布了亚马逊云科技关于推动生成式AI普惠化的四项重要举措:
首先,亚马逊云科技推出了新服务Amazon Bedrock的预览版。据称,这是客户使用基础模型构建和扩展生成式AI应用程序的最简单的方法。
“用户完全不必担心后端所使用的各种基础资源的申请、管理和运营的服务,这些都可以交给Amazon Bedrock来完成。”陈晓建表示,“Amazon Bedrock中已经预设了一些模型,包括亚马逊云科技自己开发的两个基础大模型——Titan Text和Titan Embeddings,以及来自AI21 Labs、Anthropic、Stability AI等第三方合作伙伴的模型。用户可以选择最适合自己应用场景的大模型。”
其次,亚马逊云科技还宣布,基于Amazon Inferentia2芯片的Amazon EC2 Inf2实例已全面可用,以它为核心能够打造最具成本效益的生成式AI云基础设施。众所周知,生成式AI推理工作负载的要求很高。Inf2是亚马逊自研的推理芯片的第二代,相比第一代芯片,不仅吞吐量提升了4倍、延迟缩短至十分之一,还实现了加速器之间的超高速网络连接;与同类的Amazon EC2实例相比,性价比提升40%,将云中推理的成本降至更低。
再次,亚马逊云科技还宣布,基于Amazon Trainium芯片的新型Trn1n实例正式可用。这是一个网络增强型的新实例,它将网络带宽提高了一倍,达到1.6TB,为训练生成式AI模型提供了更高的性能。
最后,基于AI的编程助手Amazon CodeWhisperer正式可用。个人开发者可以免费访问Amazon CodeWhisperer,没有任何使用限制。
Amazon CodeWhisperer可以实时生成代码的建议。另外,它还是目前唯一一个具备安全扫描的AI编程助手,可以发现一些难以查找的漏洞,并给出补救建议。据陈晓建介绍,在Amazon CodeWhisperer预览期间,亚马逊云科技曾经做过一项生产力测试,与未使用Amazon CodeWhisperer的人相比,使用CodeWhisperer的人完成任务的速度平均快57%,成功率提高27%。毋庸置疑,Amazon CodeWhisperer是一款能够有效提高开发效率的工具。
“我们正处在一个令人激动的技术转折点。在生成式AI领域,我们致力于推动技术的普惠化,即将生成式AI技术从研究和实验领域释放出来,不只让少数初创公司与资金雄厚的大型科技公司受益,而是让各种规模的组织、开发人员都能从中受益。”陈晓建相信,“生成式AI的快速发展,将给业界带来许多新机会,并且有望重塑现有流程。”
降低生成式AI的应用门槛
从芯片到通用训练大模型平台,再到面向开发者的AI编程助手,亚马逊云科技提供这些综合能力,其核心目的就在于全方位降低各行各业客户使用生成式AI的技术门槛、成本门槛,让更多的企业和个人更容易、更有性价比地使用生成式AI。
从大模型的使用来看,用户希望找到最合适他们业务场景的大模型,而且这个大模型最好还能与其业务程序无缝集成。对于大量to B客户来说,他们的想法很单纯,就是借助生成式AI能力为其业务赋能。因此,如何以最低成本、最简单有效的方式使用大模型成了关键。实际上,很多客户自身并不具备高超的技术能力,也没有充足的时间,从头自己搭建一个环境来训练大模型。事半功倍的方式是,依托一些已有的大模型环境。用户根据自己对行业的积累和理解,以及行业数据,对这些通用的大模型进行定制化、优化和重新训练,最终为其业务所用。
据了解,Amazon Bedrock以及它所包含的模型,目前正处于邀请测试的状态。一家海外的智能文档初创公司Coda已经开始试用Amazon Bedrock,访问Titan模型;飞利浦医疗影像系统也计划试用Amazon Bedrock,进一步提升其AI能力。
“实现AI的普惠化,大模型只是其中的一个部分而已。用户还需要强大的基础能力作为支撑。”陈晓建表示,“亚马逊云科技推出的与生成式AI相关的众多产品和服务,能够帮助用户实现大模型为业务赋能的目标。”
亚马逊云科技大中华区数据技术专家团队总监王晓野补充说:“以实现AI的普惠化为目标,亚马逊云科技的所有服务都是从客户需求出发,关注如何帮助客户找到最匹配其业务场景的模型,以及如何安全地进行模型定制。这既需要像Amazon Bedrock这样的专业托管服务,也需要亚马逊云科技提供的其他相关能力,包括计算、存储、安全等能力。
从成本角度来看,亚马逊云科技提供的EC2实例,包括来自于Intel、AMD和NVIDIA的各类最先进的芯片,同时还有Trainium训练芯片,以及Inferentia和Inferentia2推理芯片等,通过持续的技术创新与产品迭代,为AI应用提供最强劲也是最具性价比的算力支持。
陈晓建举例说,BERT是众多训练环境中常用的一种。一个简单的BERT环境,如果基于英伟达的GPU实例并使用16个节点,简单的模型训练就需要约13个小时;而在亚马逊云科技的内部测试中,基于亚马逊云科技自研的Trainium训练芯片,同样使用16个节点,只要5个小时就能完成训练任务。由此证明,亚马逊云科技的自研芯片能够帮助用户实现数倍的性价比提升。
另一个针对大模型部署的例子,比如基于NLP自然语言处理的流行的模型,将它部署到GPU的环境中,至少需要8块GPU卡才能完成任务;而如果采用亚马逊云科技Inferentia2,同样的负载只需要4颗Inferentia2芯片就能胜任。这样一来,用户整个的硬件部署环境的复杂性和成本都降低了一半。
“凭借多年来不断积累的云能力,亚马逊云科技能够为用户提供包括数据存储、Amazon SageMaker训练平台,以及数据隐私保护等全面的能力,让用户在一个安全、高效的环境中进行模型训练。”陈晓建如是说。
归纳来说,亚马逊云科技在推动生成式AI普惠化方面的优势在于:第一,通过丰富的产品组合和托管式的服务,降低客户在大规模训练和部署方面的难度;第二,提供多样化的模型,让客户拥有选择权;第三,提供强大的安全能力,确保客户在训练和部署定制化模型时的数据安全。
为用户赋能,而不是打造模型市场
Amazon Bedrock并不是亚马逊云科技第一次推出方便用户自己进行模型训练的产品。实际上,亚马逊云科技一直都有一套完整的大模型训练能力,Airbnb、GE等国际大企业也都在使用亚马逊云科技底层的计算资源、训练框架和训练平台,进行自己的大模型训练。比如,通过Amazon SageMaker,用户可以很好地执行从数据标注、大规模分布式训练到机器学习模型运维和在线推理的端到端任务。
GE Healthcare近年来积极地将机器学习技术用于从利用患者记录分析护理质量的数据挖掘平台,到预测出院后并发症的算法,旨在达到更好的疗效,同时降低成本。亚马逊云科技为GE Healthcare提供了Amazon SageMaker机器学习平台,使得其大规模部署机器学习解决方案成为可能。未来,GE Healthcare将借助亚马逊云科技的平台,不断扩充算法,为医疗设备和应用提供更多的智能功能,进一步提升服务质量。
Airbnb一直在努力寻找方法,提高客服聊天机器人应用程序所使用的自然语言处理模型的性能。针对基于PyTorch的BERT模型,与GPU实例相比,使用由AWS Inferentia提供支持的Amazon EC2 Inf1实例时,吞吐量有两倍的提升。Airbnb期待在未来将Inf1实例用于支持更多模型和应用。
当前,生成式AI的火爆,为AI的普惠化又添了一把柴,同时也催生了新的需求,即如何使用用户自身的数据与适合的大模型,进行定制化训练。亚马逊云科技Amazon Bedrock应运而生。当前,Amazon Bedrock的应用还处于初级阶段,很多技术细节还没有公开。不过可以肯定的一点是,在整个开发之中,Amazon Bedrock始终将数据和用户业务的安全性作为非常重要的因素。陈晓建介绍说:“在开发过程中,整个Amazon Bedrock系统中的所有数据都是加密的,每个用户的环境也都处于单独的私有网络环境中,这样可以确保从网络到存储的各个方面实现对数据和业务的保护。”
作为行业客户,当然都希望找到更加适用于他们所在行业和满足具体业务需求的模型,所以才有了预置在Amazon Bedrock中的Stability AI、Anthropic、AI21 Labs的模型。它们各有所长,能够满足不同层面用户对生成式AI模型的需求。Amazon Bedrock虽然是一个开放的平台,只要是业内领先的模型都有可能进入。但是亚马逊云科技的初衷并不是要将Amazon Bedrock打造成一个开放的模型市场,其规模并不会无限扩大。陈晓建表示:“我们要提供负责任的AI服务,它包含六大支柱,即公平性、可解释性、隐私性、安全性、鲁棒性、治理和透明度,最终目标还是为用户赋能,而不在于模型本身。”
人工智能的本质上就是算力、算法和数据。为了推动生成式AI的普惠化,不仅需要底层算力的支撑,还要有开放式的、多元的基础的大模型(Foundation model),安全的、保证用户隐私的训练环境,以及像CodeWhisperer这样细分领域的解决方案。而这些正是亚马逊云科技的能力所在、优势所在。
推动生成式AI的普惠化,亚马逊云科技说到做到。
「往 • 期 • 精 • 选」
微信扫码关注该文公众号作者