Redian新闻
>
都是做 AIGC,亚马逊云科技怎么就那么“不一样”?

都是做 AIGC,亚马逊云科技怎么就那么“不一样”?

公众号新闻


作者 | 鲁冬雪

去年起,生成式 AI 技术的发展引起了广泛关注,其中就包括 OpenAI 的 ChatGPT 模型,ChatGPT 模型甚至可以算为自然语言处理领域的重要里程碑之一,不仅在各种应用场景中得到了广泛的应用,同时也激发了各大科技公司的竞争热情。

4 月 13 日,在 AIGC 圈内一直处于“隐身”状态的亚马逊云科技突然加入生成式 AI 竞赛。不鸣则已一鸣惊人,与大多服务 C 端用户的科技公司和那些选择在热点期发布 AIGC 产品不同的是,拥有丰富企业服务经验的云厂商亚马逊云科技打出了一套组合拳,结合多年对企业需求的观察,依托自己在云资源、云计算、机器学习技术研发等多方面的优势,从大模型到生成式 AI 工具,为大家交上了一份漂亮的答卷:

  • 推出 Amazon Bedrock 服务和 Amazon Titan 大语言模型,以帮助云企业提高效率和创新能力;

  • 提供两款基于自研 AI 训练 (Trainium) 与推理芯片 (Inferentia) 的专门针对生成式 AI 优化的高性价比的虚机实例 EC2 Trn1n 和 EC2 Inf2,帮助企业大幅节省生成式 AI 训练和推理的成本;

  • 发布 AI 编码助手 Amazon CodeWhisperer,面向所有个人用户免费开放,不设任何资质或使用时长的限制!

一、意料之中:
亚马逊云科技基于 2B 经验及 ML 优势交出“漂亮答卷”

在过去几个月,全球的科技公司几乎都发布了自家的 AIGC 类产品,生成式预训练语言模型更是成为了各家技术的博弈点。在这个过程中,亚马逊云科技的动作显得慢了一些,但其实一直在背后憋大招。上周五亚马逊云科技终于发布了生成式 AI 系列重磅产品,性能都颇为强悍,但也都在意料之中。

为什么会这样说?

以 ChatGPT 为代表的 AIGC 日益火热,让大家对 AI 技术产生了新关注。AIGC(生成式 AI)其背后的核心技术之一就是机器学习(ML),机器学习算法可以根据用户的输入和提示生成内容,这些内容包括但不限于文本和图片;机器学习模型则是基于大量数据进行预先训练的大模型,被称为基础模型(Foundation Models)。而机器学习创新一直是亚马逊云科技的 DNA。

我们能看到,亚马逊云科技多年来一直在不断降低机器学习技术的使用门槛,为机器学习提供高性能、可伸缩的基础设施和具有超高性价比的机器学习训练和推理,在人工智能和机器学习堆栈的三个层级都投入了众多技术研发成本,产出了不少重磅的产品组合。亚马逊云科技拥有超过 20 年人工智能和机器学习的实践经验,在赋能自有业务与千行百业创新方面做出了很多成绩。亚马逊云科技给企业提供的许多功能都是由机器学习驱动的,比如电商推荐引擎、运营中心捡货机器人的路径选择以及供应链、预测和产能规划等;又比如亚马逊云科技自己的 Prime Air(无人机)和 Amazon Go(线下无人零售实体店)中的计算机视觉场景中也都使用了深度学习技术。

这些技术上的积累,让亚马逊云科技站在了机器学习领域前沿,他们观察到目前机器学习技术正处于“拐点期”,计算能力提升、数据增长、模型复杂度提高三大因素正在驱动着机器学习技术的下一步演进。机器学习技术的演进直接带来了基础模型的爆发式增长,据亚马逊科技公开演讲中的数据,该类模型通常包含数十亿个参数或变量,像 2019 年最大的预训练模型是 3.3 亿个参数,但现在最大的模型的参数已超过 5000 亿,这相当于在这几年间,变量增加了 1600 倍。

同时,亚马逊云科技在与 Intuit、汤森路透、阿斯利康、法拉利、德甲联赛、3M 和宝马等数以万计的企业打交道的过程中,发现了许多企业对于生成式 AI 的诉求。根据当前大多业务的发展,企业需要能够直接找到并访问高性能基础模型,这些模型需要能够给出最匹配业务场景的优秀反馈结果。紧接着企业希望无缝与应用程序集成且无需管理大量基础设施集群的同时,还不会增加太多成本。在落地过程中,企业还需要自己的技术团队能够快速上手,能够基于基础模型利用自己具有“弹性”的数据构建差异化的应用程序。此外,企业需要在保证数据安全和隐私保护的同时,还能够控制数据共享和使用。

当下的企业需求确实比较复杂,但“复杂性”也不是一朝而成的,而亚马逊云科技作为行业发展的观察者,也早早就在机器学习方面做不同程度的技术探索,将这些企业痛点逐一击破。可以说,我们今天看到的亚马逊云科技发布的生成式 AI 和大模型产品,其实早就有迹可循。

图:在亚马逊云科技平台上构建生成式 AI

二、与众不同:
亚马逊云科技的生成式 AI 主要面向企业

亚马逊云科技的天然基因就是有足够丰富的企业服务经验,所以与其他家推出的面向大众的 AIGC 类的产品不同,亚马逊云科技此次推出的产品,主要是瞄准了企业,深入对云基础设施和应用程序的变革,以推动生成式 AI 的创新。

为了解决企业需求,亚马逊云科技的生成式 AI 技术在过去几年里主要做了以下 5 方面的技术探索:

  • 灵活性:从 AI21 Labs、Anthropic、Stability AI 以及 Amazon 构建的基础模型中选择,以找到适合企业使用的模型。

  • 安全自定义:仅需数个已标记样本,就可为企业企业定制基础模型。由于所有数据均已加密,不会从亚马逊云科技虚拟私有云(VPC)泄露企业数据,所以数据将始终保持私密且机密。

  • 成本效益不错的基础设施:利用由亚马逊云科技设计的机器学习芯片和 NVIDIA GPU 驱动的基础设施,可为生成式人工智能带来最佳性价比。经济有效地扩展基础设施,以训练和运行包含数千亿个参数的基础模型。

  • 轻松上手基础模型构建:使用熟悉的控件与亚马逊云科技能力和服务,如 Amazon SageMaker 和 Amazon S3 的深度和广度的集成,快速将基础模型集成并部署到企业在亚马逊云科技上运行的应用程序和工作负载中。

  • 生成式 AI 技术支持的解决方案:由于内置生成式人工智能,如 Amazon CodeWhisperer(一种人工智能编码伴侣)等服务可帮助企业提高效率。此外,可使用亚马逊云科技样例解决在方案部署中常见的生成式人工智能案例,如调用归纳总结与问答。此类解决方案将亚马逊云科技人工智能服务与领先的基础模型相结合。

在企业的期待中,亚马逊云科技在本次发布会中推出了 Amazon Bedrock 和 Amazon Titan 模型,借助基础模型构建和扩展生成式 AI 应用程序的最简单途径。Amazon Bedrock 既提供自研的大语言基础模型—— Amazon Titan Text 、Amazon Titan Embeddings,也与 AI21 Labs、Anthropic、Stability AI 等基础模型提供商广泛合作,助力企业轻松灵活构建生成式 AI 应用,降低所有开发者的使用门槛。

展开来讲就是,在 Bedrock 上,用户可以通过可扩展、可靠且安全的亚马逊云科技托管服务,访问从文本到图像的一系列强大的基础模型以及 Amazon Titan 基础模型。凭借 Bedrock 所带来的无服务器体验,企业可以快速找到适合自身业务的模型,在确保数据安全和隐私保护的前提下,使用自有数据基于基础模型进行个性化定制,将定制化模型集成并部署到他们已有的应用程序中,不需要管理其他任何基础设施。

Bedrock 最突出的能力就是极易定制模型,企业只需要向 Bedrock 提供 Amazon S3 中的 20 个标注好的数据示例,Bedrock 就可以针对特定任务完成模型微调,整个过程中,用户数据不会离开 VPC,有效地保证了用户的数据安全与隐私。

另外值得一提的是,Bedrock 还允许用户通过 API 访问来自 AI21 Labs、Anthropic、Stability AI 和亚马逊云科技的基础模型,Bedrock 的 serverless 方案,让用户只需调用 API,不需要关心底层基础设施,就可以轻松获得多语言 LLM 用于生成西班牙语 / 法语 / 德语 / 葡萄牙语 / 意大利语 / 荷兰语文本、LLM 用于会话和文本处理任务、文生图等大模型能力。

左:来自亚马逊云科技的基础模型;右:来自 AI21 Labs、Anthropic 和 Stability AI 的基础模型

为了持续推动生成式 AI 在企业落地更多优秀实践,亚马逊云科技发布的 Titan 基础模型可以识别和删除客户提交给定制模型的数据中的有害内容,拒绝用户输入不当内容,过滤模型中不当内容的输出结果。本次亚马逊云科技的发布会上主要发布了两个 Titan 模型——针对总结、文本生成、分类、开放式问答和信息提取等任务的“生成式大语言模型”及能够将文本输入翻译成包含语义的数字表达的“文本嵌入(embeddings)大语言模型”。虽然这种大语言模型不生成文本,但在个性化推荐和搜索等应用程序上面的表现却十分亮眼,因为相对于文字匹配,编码对比可以帮助模型反馈更相关的结果。

三、技术革命:
生成式 AI 也需要生态

事实上,无论运行、构建还是定制基础模型,除了这些业务需求,企业技术的底层需要还是离不开高性能、低成本且为机器学习专门构建的基础设施。于是,亚马逊云科技不只是在模型上下功夫,在生态方面也做了一些努力。

亚马逊云科技扩大了对定制芯片的创新,在本次发布会上,亚马逊云科技全新推出了两款专门针对生成式 AI 优化的计算实例 EC2 Trn1n 实例和 EC2 Inf2。

图:亚马逊云科技专为生成式 AI 设计的加速器

其中需要说明的是,训练实例 EC2 Trn1 由其自研芯片 Trainium 支持,与其他任何 EC2 实例相比,可节省高达 50% 的训练成本,历经优化后,已经可以在与高达 800Gbps 的第二代 EFA(弹性结构适配器)网络相连的多个服务器上分发训练任务,但 Trn1n 实例更为强悍它可以提供 1600 Gbps 的网络带宽,专为大型网络密集型模型设计,其性能比 Trn1 高出 20%。

企业在超大规模集群中部署 Trn1 实例时,数量就已经可以扩展到在同一可用区中 3 万个 Trainium 芯片,相当于超过 6 exaflops 的计算能力。Helixon、Money Forward 和亚马逊云科技的搜索团队曾在使用 Trn1 实例后,将训练大规模深度学习模型的时间从几个月缩短到了几天。所以,如果不出意外,此次亚马逊云科技发布的性能全面提升的全新网络优化型 Trn1n 实例将会带给我们更多惊喜。

无独有偶,2018 年亚马逊云科技发布了首款推理专用芯片 Inferentia,亚马逊云科技使用 Inferentia 运行了数万亿次推理,节省了数亿美元的成本,此次推理实例 Inf2 则是基于其自研芯片 Inferentia2,针对运行数千亿个参数模型的大规模生成式 AI 应用程序进行了优化,吞吐量提高了 4 倍,延迟降低了 10 倍,从这个数据来看,亚马逊云科技再次帮助企业大幅节省了生成式 AI 训练和推理的成本。

此外,Inferentia2 还可实现加速器之间的超高速连接以支持大规模分布式推理,与同类 Amazon EC2 实例相比,这些能力将推理性价比提高了 40%,并把云中的推理成本降到最低,企业利用 Inferentia2 可将部分模型的吞吐量提升至原来的两倍。

除了在芯片方面的创新,亚马逊云科技还发布了 AI 编码助手 Amazon CodeWhisperer,这是一款面向个人开发者免费使用的辅助代码编写工具,是一种人工智能代码生成扩展,目标是提高软件开发者的工作效率。开发者可以在没有亚马逊云科技账户的情况下,用邮箱完成 CodeWhisperer 的注册后开始使用,同时该工具对开发者不设任何资质或使用时长的限制。

图:CodeWhisperer 三大能力

CodeWhisperer 可以更快地完成更多工作,避免软件开发人员花费大量时间编写非常简单且无差别的代码,CodeWhisperer 作为 AI 编码伴侣,它使用引擎盖下的 FM 通过根据开发人员的自然语言评论和集成开发环境 ( IDE ) 中的先前代码实时生成代码建议,从根本上提高开发人员的工作效率。

在软件供应链安全问题频发的今天,CodeWhisperer 有一个非常突出的亮点,其可以增强代码的安全性,该工具利用了亚马逊云科技在安全方面的积累来扫描各种安全问题,能自动扫描代码中的安全漏洞并帮用户修复。目前该工具提供 Python、Java、JavaScript、TypeScript、C#、Go、Kotlin、Rust、PHP 和 SQL 等十余种开发语言供开发者选择,同时开发者还可以通过在 VS Code、IntelliJ IDEA、Amazon Cloud9 等集成开发环境中的 Amazon Toolkit 插件访问 CodeWhisperer。

构建像 CodeWhisperer 这样强大的应用程序对开发人员来说是变革性的,但是从整个生成式 AI 生态的发展来看,利用正确的基础模型进行构建相关工具是非常有必要的。生成式 AI 的发展永远不仅仅是大模型,它需要在基础设施、一站式应用开发工具等层面“全面开花”,而亚马逊云科技已经为行业做出了一个很好的表率。

纵观整个行业的发展,对于云厂商来说,只有打造生态协同效应,切实帮助企业实现降本增效,才能走得更远。而形成“大小生态”的良好闭环是打造生态协同的必由之路,亚马逊云科技似乎就是在探索这样的一条路。人工智能作为云计算的一部分,人工智能产品构建自己的“AI 小生态”,通过“小生态”的构建去推动“云平台大生态”的发展,云厂商再利用“大生态”的势能反哺“AI 小生态”,转而促进单一 AI 能力的发展。

从目前亚马逊云科技搭建的“AI 小生态”来看,这些生成式 AI 能力和工具,不再是那些冰冷的性能提升数字,而是卓越性价比,为企业解决问题提供了切实可行的企业技术解决方案。回溯本身,亚马逊云科技之所以能够实现这些突破,源于将每一个客户的难题都视为一个新的探索方向,将“探索精神”和“创新精神”贯彻始终,输出接地气的技术能力和解决方案。不积跬步无以至千里,亚马逊云科技凭借其多年来积累的企业服务经验,深刻理解企业需求,并在实际业务中持续获取洞察,这必定能帮助亚马逊云科技在市场竞争中脱颖而出。

据悉,近期亚马逊云科技在生成式 AI 能力方面的发声不仅只有这一次发布会,有内部消息称,5 月 25 日将举办亚马逊云科技大模型及生成式 AI 发布深度解读大会,感兴趣的同学可以立即点击“阅读原文”进行报名。

今日荐文



狂买GPU、四处挖人,马斯克:我要做理解宇宙的TruthGPT

大数据已死?谷歌十年老兵吐槽:收起 PPT 吧!数据大小不重要,能用起来才重要

大型语言模型也能跑在浏览器上了!又一ChatGPT平替诞生,训练成本8.5万美元

马斯克爆料Twitter裁了八成员工;OpenAI CEO:GPT-5根本不存在;小鹏被曝年终奖打0.5折 | AI一周资讯


你也「在看」吗? 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
“臭豆腐”妙诗一首。。。。。。。2000亿到200亿,暴跌90%的前果链一哥瑞声科技怎么了?【雨水】心雨细无声· 写在老爸“七七”之日将被eBay赶超,亚马逊的未来在哪里?亚马逊云科技把Serverless的应用门槛降下来了亚马逊营销总监:快速崛起的亚马逊是否在游戏业找到了自己的路?动物便便后怎么就那么干净?不像人类还要费事擦屁股......65岁李宗盛伦敦开唱:不一样的情爱男女,不一样的人生况味亚马逊云科技 Lambda 引入响应有效负载流2023最重磅!亚马逊云科技出海日金融专场等你!对话出海企业:“云襄百业,共拓全球”——2023亚马逊云科技出海日圆桌论坛5岁+中英双语: 风靡全球50年的品格教养童话绘本,亚马逊5星好评!清仓中!3个月大裁2.7万员工,亚马逊宣布继续裁员9000人;26岁年薪百万!华为又一天才少年曝光;腾讯内部研发人员占比74%丨雷峰早报2000亿到200亿,暴跌90%的前果链一哥瑞声科技怎么了?丨智氪“选择和谁结婚,真的不一样”冬季周末的一大享受云端安全由繁到简,云安全文化护航下的“业务创新”进入新局面? | 亚马逊云科技 re:Inforce 2023 全球大会老乡别怕,我们是农管,“和城管不一样”。我也来一首类似的。。。。。。大咖云集,干货满满,来亚马逊云科技中国峰会深度解读AIGC的现在和未来“像挤奶一样” 澳男捐精后发文吐槽:设备老旧,连A片都是上世纪的探索 17 年,亚马逊云科技重新定义 Serverless罗烂岗系列 | 华女店内做美甲,亚马逊送货工人冲进来,扔下自己手中的箱子,抢走华女包就跑...“好像挤奶一样” 澳洲男子捐精后发文吐槽:设备老旧,A片都是上世纪的20年不变的初心,亚马逊云科技为初创企业的独角兽梦想加速赋能!素颜“跟护照不一样”!加州妹被海关拦下 差点搭不上飞机倒数7天!交易门 X 亚马逊云约你深圳见!愤怒!尔湾华裔小孩被亚马逊快递车撞死,亚马逊竟将责任推得一干二净老带孩子出去玩,就那么有意思吗?去年股价跌逾35%,亚马逊员工今年薪酬最高缩水一半短暂逆风后,亚马逊将昂首向前?亚马逊云游戏遇困境:自家游戏都不愿上,50余款三方游戏本月跑路亚马逊云科技开源 Mountpoint for Amazon S3,通过挂载点技术简化 Amazon S3 对象存储的使用加速步入Serverless时代,与亚马逊云科技一同领驭创新浪潮草书《兰亭序》
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。