大模型火了!但许多人只注意到了露出海平面的冰山一角。行业内,越来越多的人开始追逐基础模型,又有谁像亚马逊云科技那样,始终把精力和投入放在海平面下更庞大的冰山上,为基础模型的应用提供全面、有力的支撑,包括加速芯片、数据库、数据分析、数据安全服务等。
“赋能生成式AI新时代,助力数据和AI普惠”,亚马逊云科技大中华区产品部总经理陈晓建在亚马逊云科技近日举办的生成式AI构建者大会上的主题分享再次阐明,亚马逊云科技是AI普惠的倡导者、实践者和引领者。毋庸置疑,生成式AI如今已成为各行业、各组织的首要关注点。所有的企业都在思考或者进行尝试,借助生成式AI技术赋能业务创新,在智能化时代到来时率先起飞。生成式AI是由机器学习领域的基础模型驱动的。基础模型能够学习复杂概念并执行多种任务。令人倍感兴奋的是,企业可以使用同一个预训练的基础模型,适应多项任务,并通过少量私有数据集即可进行自定义,而无需像传统机器学习模型那样从头训练。有人开发基础模型,就需要有人为基础模型的落地应用提供全位的支撑。虽然各自的角色、分工不同,但都不可或缺。作为AI普惠的推动者,亚马逊云科技能够提供完整的、端到端的生成式AI技术堆栈,从底层的加速层(包括加速芯片、存储优化等),到中间层模型的构建工具和服务,再到最上层的生成式AI的相关应用,每一层都在针对客户的不同需求持续创新。“让任何人都能够获得和大型企业一样先进的基础设施和成本,从而实现自己的创新”,这既是亚马逊云科技努力的目标,也是对客户的郑重承诺。通过创新的平台、工具和服务,亚马逊云科技致力于实现生成式AI技术的普惠化,赋能更多企业和个人开发者加速创新。“开发生成式AI应用是一项充满挑战的系统工程,而不是单纯的产品和服务的拼接。因此,加速最终应用的商业化落地,除了亚马逊云科技自身的资源以外,还需要构建强大的合作伙伴生态,共同解决生成式AI应用中的各种技术问题。”陈晓建表示,“除了云服务之外,亚马逊云科技还提供解决方案架构师、产品技术专家、人工智能实验室、数据实验室、快速原型团队、专业服务团队、培训与认证等多种资源,并与生态合作伙伴构建生成式AI的完整体系,协同助力客户成功。”为生成式AI的落地保驾护航,亚马逊云科技是这样说的,具体又是如何做到的呢?围绕应用场景,打造工具和基础设施、数据基座,致力于构建AI原生应用,并提供生成式AI服务,助力企业和开发者释放生成式AI的巨大潜力。1.从典型场景入手。麦肯锡咨询发布的生成式AI生产力前沿技术报告显示,在生成式AI技术带来的经济效益中,大约3/4来自于以下四个方面——营销与销售、产品与研发、软件工程、客户运营。这些正是生成式AI当前应用的典型场景。在这些场景中,生成式AI技术给客户带来了最直观的价值:增强客户体验,提升员工生产力与创造力,优化业务流程。举例来说,海尔创新设计中心利用生成式AI实现文生图、图生图、定量图和全场景图的提效,自动化设计系统应用使得相关业务的操作周期缩短了20%;国内知名的游戏企业上海沐瞳科技使用Amazon Bedrock,进一步优化了游戏开发的业务流程。正是看到了生成式AI技术带来的诸多效益,越来越多的行业用户才“爱”上了生成式AI,先行先试。2.借助专门构建的生成式AI工具和基础设施,快速构建高性价比的生成式AI应用。在众多的基础模型中,应该如何便捷安全地选择最适合自己业务场景的基础模型,是每一家企业在构建生成式AI应用时面临的第一个挑战。亚马逊云科技的Amazon Bedrock服务与Amazon SageMaker Jumpstart相结合,能够让客户更轻松、安全地选择基础模型。使用过Amazon Bedrock的很多客户都认为,Amazon Bedrock是其使用基础模型构建和扩展生成式AI应用程序最简单的方法。它是一项无服务器服务,提供广泛的模型选择(近期还加入了Meta的下一代开源大模型Llama2和Anthropic的Claude2等热门基础模型)、数据隐私,并且能够自定义模型,而无需管理任何基础设施。客户可以从Amazon SageMaker Jumpstart中选择开源的基础模型,然后根据自身需求选择全量微调、轻量微调等不同方式,进一步确定微调框架,再利用分布式训练实现微调,从而更好地评估微调效果。总之,生成式AI应用的落地,需要高性价比的基础设施作为关键支撑。10多年来,亚马逊云科技对全球基础设施进行深度投资,为客户提供了广泛的加速器选择,包括强大而灵活的基于GPU的解决方案,速度更快,且训练成本更低。这也吸引了像OPPO、Airbnb、Sprinklr、Autodesk等一大批客户,持续地使用亚马逊云科技的专用加速器处理要求严苛的机器学习工作负载。3.夯实数据基座。数据是生成式AI的基础。构建面向生成式AI的强大的数据基座,需要一套全面的服务。举例来说,亚马逊云科技针对生成式AI领域的用户个人信息、会话信息管理、私域知识库等应用场景提供了专门构建的数据库。针对检索增强生成(RAG)需要处理的向量数据,亚马逊云科技为Amazon OpenSearch Service、Amazon Aurora PostgreSQL和Amazon RDS for PostgreSQL加入了向量数据库功能,允许向量与数据同地放置,更轻松地连接数据并减少数据重复。西门子中国与亚马逊云科技合作开发了基于生成式AI技术的智能会话机器人“小禹”,它采用“检索增强生成RAG架构+向量数据库”设计,大大缩短了整体开发与部署时间。未来,西门子还将不断扩展机器人“小禹”的服务领域,比如40%的IT支持问题可以利用“小禹”的知识查询和问答快速解决,产品研发中大约30%与编码,测试、调试和文档编制相关的任务也可以利用“小禹”加速完成。打造数据基座,还要处理好数据集成、数据治理等方面的问题。在数据集成方面,ETL是端到端数据旅程迫切需要解决的问题。在Zero-ETL愿景下,亚马逊云科技推出的Aurora Zero ETL for Redshift Integration,允许存储在Amazon Aurora中实时产生的业务数据,无需ETL工具,便能自动同步到数据仓库Amazon Redshift中,支撑近实时的海量数据聚合分析。亚马逊云科技通过深化服务之间的集成,使得Zero-ETL从理想照进了现实,包括Amazon S3、Amazon Aurora、Amazon Redshift、Amazon SageMaker、Amazon EMR、Amazon Athena、Amazon Kinesis等在内的各项服务之间的深度的数据集成,能够有效帮助企业执行分析和机器学习,且无需移动数据。在数据治理方面,亚马逊云科技提供的Amazon DataZone数据治理服务,允许客户跨组织边界发现、访问、共享和治理大规模数据,同时减少企业内部成员访问数据和使用分析工具时的工作量。借助Amazon DataZone,数据使用者可以通过统一的数据分析门户,在亚马逊云科技账户之间共享和访问数据,实现跨部门、跨组织的数据应用,并开展数据协作。4.借助云原生服务,加速AI应用的构建。亚马逊云科技在这方面积累了丰富经验,比如以微服务化和事件驱动架构为核心的设计框架,以松耦合的方式处理每个功能模块之间的互相依赖;通过Serverless First,简化运维,提升效率;基于数据决策优先,在生成式AI应用的设计理念中强调数据能力的提升;建立“安全围栏”,将安全与数据的合规、保护放在重要位置。5.提供开箱即用的生成式AI服务。以软件开发者为例,通常他们需要花费大量时间编写相当浅显或者无差别的代码,而真正能用于创新的时间少之又少。亚马逊云科技的Amazon CodeWhisperer作为人工智能编码伙伴,可以实时生成代码建议,从根本上提高开发人员的生产力。测试显示:使用Amazon CodeWhisperer的人完成任务的速度平均提升57%,成功率提高27%。最近,亚马逊云科技新推出了Amazon Whisperer的自定义功能,能够生成优于之前的代码建议。埃森哲的Velocity平台软件工程最佳实践团队在想方设法提高开发人员的工作效率,在搜寻过多种工具后,发现Amazon CodeWhisperer可以减少30%的开发工作量,并加快编码任务,让团队成员更加专注于安全、质量和性能的提升。据陈晓建介绍,亚马逊云科技通过开箱即用的生成式AI服务及工具,已帮助超过1000家中小企业和初创公司快速实现生成式AI创新,并且赋能超过10万名中国开发者。在生成式AI日益盛行的今天,亚马逊云科技肩负的使命没有改变,就是通过为生成式AI打造的基础设施、工具和服务,推动生成式AI技术的普惠化。与此同时,亚马逊云科技也承诺,将以一种负责任的态度提供AI的服务。