生成式 AI 火了，Stable Diffusion 幕后开发公司 Stability AI 宣布获得 1 亿美元融资

2022-10-20 05:10

作者 | 刘燕

生成式 AI 可太火了。

InfoQ10 月 18 日获悉，开源人工智能公司 Stability AI 宣布获得 1.01 亿美元融资。本轮投资由 Coatue、光速创投领投，O'Shaughnessy Ventures 参投。

所筹资金将用于加速开发面向全球消费者和企业用例的开放 AI 模型，包括图像、语言、音频、视频、3D 等。此外，这笔资金还将用于吸纳更多的人才。Stability AI CEO Emad Mostaque 表示，他预计明年，公司员工人数将从 100 人增加到约 300 人。最近，Stability AI 已招聘了几位有行业影响力的人才，包括来自 Google Brain 的研究科学家 hardmaru 以及未来学家、公共演讲者 Daniel Jeffries。

据彭博社报道，一位因细节未公开而要求不具名的知情人士称，这轮融资完成后， Stability AI 的估值约为 10 亿美元，这意味着，Stability AI 成为新晋 AI 独角兽。

资料显示， Stability AI 由 CEO Emad Mostaque 于 2020 年创立，Emad Mostaque 毕业于牛津大学，获得数学和计算机科学硕士学位。此前他曾在多家对冲基金担任分析师，之后转向更面向公众的工作。Mostaque 曾称他创业的动机是个人对 AI 的迷恋以及他认为，开源 AI 社区缺乏“组织”。Mostaque 曾在采访中表示，“计划使用我们的计算来加速开源基础人工智能。”

这笔融资正是当下生成式 AI 火爆的一个表现，由人工智能驱动的内容生成需求正在加速增长。Stability AI 是近期大火的 AI 绘画神器 Stable Diffusion 背后的开发公司。

Stability AI 介绍，Stable Diffusion 是一个文本至图像的模型，它能让数十亿人在几秒钟内创建出令人赞叹的艺术品。在速度和质量方面，它都有所突破，这意味着它能在消费者级别的 GPU 上运行……这能够让研究人员和……公众在各种条件下运行，使图像生成技术走向大众。我们期待围绕该模型和其他模型出现一个开放的生态系统，以探索潜在空间的边界。

今年 9 月，Stability AI 对外发布了 Stable Diffusion 的预训练模型权重，这是一个文本至图像的 AI 模型。根据文本提示，Stable Diffusion 能够生成逼真的 512x512 像素的图像以描述提示中的场景。在模型权重公开发布之前，它的代码已经发布，模型权重也有限发布给了研究社区。在最新的版本中，任何用户都可以在消费者级别的硬件中下载并运行 Stable Diffusion。

Stability AI 拥有一个在 AWS 中运行的由 4000 多个 Nvidia A100 GPU 组成的集群，用于训练包括 Stable Diffusion 在内的 AI 系统。

据 Business Insider 的报告称，该公司的维护成本相当高，其中运营和云支出超过 5000 万美元。但 Mostaque 一再强调，该公司的研发工作将使其能够更有效地训练模型。

Stable Diffusion 的很多用户已经公开发布了生成图像的样例，Stability AI 的首席开发者 Katherine Crowson 在推特上分享了许多图像。

其所具备的高度开源取向使得 Stable Diffusion 将无过滤图像生成的门槛下放到历史最低。Stable Diffusion 能够提供开源、未经过滤的图像生成功能，而且任何具备一点点技术知识的电脑用户都能轻松上手。

Emad Mostaque 曾在一次采访中表示，“真实情况是，这是一项堪称超能力般的外星科技。我们第一次见到一种老少咸宜的 AI 图像生成工具，但同时也发现不少人在用它生成伤害他人感情的内容。”

尽管 AI 生成艺术已然经历了一段时间的发展，但 Stable Diffusion 的出现可能才是这项技术的真正腾飞时刻。它可以免费使用，上手快捷，大大减少了用户生成内容的障碍。

但火爆背后，Stable Diffusion 也无法逃脱诸多争议。当这样一款工具落在普罗大众手中，接下来会发生什么实在难以预料。

基于 AI 的图像合成可能会对艺术家和艺术领域带来一定的影响，有些评论者对此感到不安。就在 Stable Diffusion 发布的同一周，一幅由 AI 生成的艺术品在科罗拉多州博览会的艺术比赛中获得了一等奖 Stable Diffusion 的开源版本已被用于创建令人反感的内容，例如暴力和色情、未经同意的名人深度伪造。出于对知识产权纠纷的担忧，Getty Images 禁止上传 Stable Diffusion 等系统生成的内容。

稳定性 AI 甚至成为美国众议院代表 Anna G. Eshoo (D-CA) 最近致国家安全顾问 (NSA) 和科技政策办公室的一封批评信的主题，她在信中敦促 NSA 和 OSTP 解决“不审核在其平台上制作的内容”的“不安全 AI 模型”的发布问题。

迄今为止，Stability AI 在很大程度上采取了一种不干涉的方法来进行审核，包括使用开源 Stable Diffusion 软件包的过滤工具，但允许用户和公司按照他们的意愿部署系统，只要他们遵守公司许可的条款。“有一部分人只是不愉快和奇怪，但这就是人性，”Emad Mostaque 在之前的一次采访中说。“事实上，我们相信这项技术将会流行，许多人工智能爱好者的家长式和有点居高临下的态度被误导为不信任社会。”

据悉，Stability AI 计划通过为客户培训“私有”模型并充当通用基础设施层来赚钱。它还提供了一个平台和 API，即 DreamStudio，个人用户可以通过该平台和 API 访问其模型。目前，DreamStudio 拥有超过 150 万用户，他们创建了超过 1.7 亿张图像，而 Stable Diffusion 每天有超过 1000 万用户“跨所有渠道。”

与此同时，Stability AI 今天上午发布的新闻稿显示，Stable Diffusion 的开源版本已被下载超过 20 万次。

除了 Stable Diffusion，Stability AI 声称还有其他可商业化的项目正在进行中，包括用于生成音频、语言、3D、甚至视频的 AI 模型，其中之一就是 Dance Diffusion，这是一种算法和一组工具，可以通过对数百小时的现有歌曲进行训练来生成音乐片段。

你也「在看」吗？ 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章