「11人改变世界」背后的 CEO。
作者 | Founder Park
Midjourney 是一家神奇的公司,11 人改变世界,创造伟大的产品。
注定会成为 Pre AGI 初年的佳话。
「我从不曾想过要一家公司,我想要有一个家。」
智源大会上,我们对话了 Midjourney 创始人 David Holz。
MidJourney 是当下最炙手可热的图片生成引擎,在 OpenAI 的 DALL·E 2 和开源模型 Stable Diffusion 等激烈竞争下,目前仍保持着多种风格生成效果的绝对领先。
以下是对谈全文,经 Founder Park 编辑。
张鹏
欢迎 David,我想这是你第一次与中国的粉丝交流,你可以借此机会向他们问好。
David Holz
哈喽大家好,Midjourney 可能还没有正式进入中国,但是如果你们已经用上了 Midjourney 的话,我希望大家都可以拥有好的体验。
在过去的 20 年里,我认识了很多国内外的创业者。我发现他们有一些共同点,他们都有强烈的驱动力,驱使他们「无中生有」地探索创造。我想知道,在你创立 MidJourney 的时候,你的驱动力是什么?在那个时刻,你渴望的东西是什么?我从来没有想过要创办一家公司。我只是想要一个「家」(home)。我希望在未来 10 年或 20 年,可以在 Midjourney 这里创造那些我所真正关心的和真正想为这个世界带来的东西。我经常思考各种各样的问题。也许我不能解决每个问题,但是我可以做出一些尝试,从而让大家都能更有能力地解决问题。因此,我尝试去思考如何解决,如何创造东西。我认为,这可以归结为三点。首先,我们必须反思自己:我们想要什么?问题究竟是什么?
然后我们要想象:我们前进的方向在哪里?有什么可能性?
最后,我们必须相互协调,与他人合作,共同实现我们所想象的事情。我认为,在人工智能方面,有很大的机会将这三部分结合起来,并创造出重要的基础设施,使我们更擅长于解决这个问题。在某种程度上,人工智能应该能够帮助我们反思自己、更好地想象未来的方向、帮助我们更好地找到彼此并合作。我们可以一起完成这些事情,并将它们融合到某种单一的框架中。我认为这将改变我们创造事物和解决问题的方式。这就是我想做的 big thing。我认为有时候(我们先做的)图片生成可能会让人感到困惑,但在许多方面,图片生成是一个已被认可的概念。Midjourney 已经成为了一个超级想象力的集合,数百万人共同探索着这个空间的可能性。在未来几年里,会有机会进行更多的视觉和艺术探索,这可能会超过所有先前历史的探索总和。这并不能解决我们面临的所有问题,但我认为这是一次测试,一次实验。如果我们能完成这次视觉领域的探索,那么我们也可以在其他事情上做到,其他所有需要我们一起探索和思考事情,我认为都可以通过类似的方式来解决。因此,当我考虑如何开始着手解决这个问题时,我们有很多想法,建了很多原型,但是 AI 领域突然出现了突破性的进展,尤其是视觉方面,我们意识到这是一个绝无仅有的机会,能创造出一些别人从未尝试过的东西。这让我们想去为之尝试。我们认为,也许过不了多久,这一切都将汇聚到一起,形成非常特别的东西。现在还只是个开始。所以,图片(生成)只是第一步,你的最终目标是解放人类的想象力。这是吸引你创立 Midjourney 的目标吗?我真的很喜欢具有想象力的东西。我也希望这个世界能有更多的创意。
许多人第一次认识你时并不是通过 Midjourney,而是通过 Leap Motion(David 的上一家创业公司)。我强烈感觉到,对你来说这两个项目可能存在一些关联,无论是驱动力或心态方面,我不知道我理解得是否正确。但我想问的是,你在 Leap Motion 的经验是否有助于你创办 Midjourney?从很多方面来看,我从 Leap Motion 中学到了很多,比如如何组建大型研究团队、如何解决以前没有人解决过的问题、如何深入思考人们该如何与技术交互。不仅仅是考虑速度、成本和规模,而是考虑我们该如何协作、如何共同前进。这非常重要,它是 Leap Motion 的核心思想之一。二者有一些相似的地方,就像 Leap Motion 一样,它迅速成长,吸引了每个人的想象力,我认为 Midjourney 也类似。但我认为二者也有一些真正不同的地方,在 Leap Motion 中,我们花了大量时间构建早期的生态系统。在硅谷,当时有这样一种信仰,即你应该先构建一个生态系统,就像 iPhone 一样。但我认为我们共同学到的是,也许你首先要构建一个真正受人们喜欢的好产品。然后,当你完成这个产品时,你可以开始着手构建生态系统。对于很多企业家来说,在早期构建生态系统可能会分散他们的注意力,我也是如此。因此,Midjourney 所做的一个很重要的不同的事情,就是专注于构建真正每个人都可以使用的东西。我以前经常用「我能不能亲手完成」来判断自己的能力。我的父亲是个外科医生,他就可以做到。我们拥有灵巧的双手。但现在我更多在思考,卡车司机会喜欢用 Midjourney 吗?有很多卡车司机在玩 Midjourney,对我来说这太酷了,这意味着我们做的更好了。
这很有趣。我们通常说空口无凭,给我看你的代码(Idea is cheap, show me the code)。但现在,想法似乎才是唯一重要的东西。只要你能通过一系列优秀的 Prompt 表达你的想法,AI 就可以帮助你实现。所以,学习和创造的定义是否正在改变?你怎么看?我觉得一个有趣的事情是,当你给人们更多的时间去创造时,他们也会对学习本身更感兴趣。例如,美国有一种很流行的艺术风格叫做装饰艺术。我从来没有关心过这种艺术是什么,直到有一天,我通过指令就可以制作出这类艺术风格的作品时,我突然对它产生了很大的兴趣,想更多了解它的历史。我觉得这是很有趣的一点,当历史成为你可以立即用起来并让你更简单地去创造的东西时,我们反而会对历史更感兴趣。如果用户交互界面变得足够好,让用户觉得 AI 成为了我们思维的延伸。AI 就仿佛是我们身体和思想的一部分,AI 又在一定程度上与历史紧密相连,而我们也将与历史紧密联系在一起。这太有意思了。当我们问用户他们最想要什么时,通常排在第一第二的回复是他们想要学习材料,他们不仅是想要学习如何使用工具,还想要了解艺术、历史、相机镜头、光彩,想要了解和掌握所有可用于创造的知识和概念。以前,知识只是过往的历史,但现在,知识成为了创造的力量。知识在当下就能立即发挥出更大的作用,人们都渴望获得更多的知识。这可太酷了。
在中国,你们的用户来自于许多不同的背景,他们可能具有不同水平的艺术创作能力。像我这样的用户还在努力制作更好的图片,但我听说许多画家和设计师正在担心他们会被AI取代。为了确保每个人都能通过AI得到助力,而不是感到困惑或被边缘化,Midjourney 可以做些什么呢?对于还没有开始他们艺术之旅的人来说,Midjourney 为他们提供了独特的机会。你会开始思考:我喜欢什么?我的审美观是怎样的?我觉得什么是美丽的?专业艺术家可能需要几十年才能做到,而现在每个人都可以做到。我们发现,人们深入反思,这几乎像是艺术治疗,让人思考他们的生活、面对的挑战、可能发生的好事或坏事,这非常有意义。我认为大多数使用它的人都有这些个人体验,它并不是竞争性或商业性的。我们发现,大多数人使用它,只是自娱自乐。他们甚至不会分享他们生成的图片。但在专业领域,它变成了增强你创造力的放大器,现在你可以制作漫画、电影或视频游戏。如果你是一个普通人,第一次在你的生活中思考美,那么艺术家现在可能在思考,如何创造整个世界和宇宙的故事。以前他们从未能够做到。普通人有更多的能力,专业人士也有更多的能力。有时很难意识到这点,因为现在用户界面都很简单。但是它们可以变得更加复杂、强大,并具有许多功能,那些功能稍后会出现。
也许 AI 不仅仅只是用来处理一张图片,它可以帮助人们处理更复杂的工作。因为在过去,当我们谈到创造力时,里面包含了许多因素,是否有创造的欲望?要创造什么样的想法?还需要具备行动的能力,执行它使其成为现实。但有时,如果可以解放创作欲望、伟大的想法和复杂的事物,AI 可以帮助你。这可能就是 AI 可以为人们提供的力量,而不仅仅是图像。对吧?这是一个非常个人化的过程,需要反思,起初我们并不知道。一开始,我看着这些(人们生成的)图片,却不明白他们要做什么。我问他为什么要做一张狗在天堂的图片?他说那是因为他的狗刚刚去世了。人们使用它的目的几乎就像艺术疗法一样。他们思考着事情,反思着他们的生活,试图弄清楚自己是谁。我认为这是非常个人化的,非常重要的,这是一些人类历史上,大多数人都没有机会做的。只有非常少数的人有机会这样做。是的,Midjourney 不仅仅是我们的业务或者工作流里的一个工具,它已经成为了我们生活中的一个新元素。
Midjourney 之所以如此美妙,是因为它将神奇的技术传递给了 1000 万人。而我知道你的团队只有 20 个人,几个月之前只有 11 个人。你们没有销售团队,没有市场团队,其中还有一些是在校生。我很好奇,这是 AI 时代的创业公司组织形式的新范例吗?我们的确是(采取这类组织形式)比较早的。我们也有一些优势,比如我有很多建立团队的经验,我的声誉也不错,能获得很多算力,并且我们很早之前就开始做了。但我觉得在几年后,随着人们学会如何建设研究团队,随着算力的压力越来越小,随着人们越来越懂得如何打造好的 AI 产品,我想我们将会看到很多这样的公司。我们可能是第一家这样做的公司,但也许在 5 年后这会是非常常见的形态。
你担心 Midjourney 今天做的事情,有一天会被发展的 AGI 能力所覆盖吗?会发生什么?像 Midjourney 这样的垂直产品的未来是什么?其中一种方式是,我们可能会与其他实验室合作,我们制作眼睛,他们制作耳朵,我们制作不同的部分,然后将它们组合起来。这种情况可能会发生。我们创造想象力,他们制作语言部分,然后我们将它们组合在一起。所以我们将一起研究这个问题。还有一种可能性,就是有这些几乎擅长所有事情的 AGI,但是也有这些部分是专业化的。世界上仍然有很多专业人士。我也认为有可能有很多人机界面方面的问题,不仅仅是关于制作美丽的图片,而是关于帮助一个人探索他们是谁,以及他们想要什么。这不是一个 AGI 的问题,而是更多地关于如何与人交互。最好的用户界面,如果仅仅是语言,那么 AGI 可能会问我们问题。但实际上用户界面不仅仅是语言,它将向你展示许多图片,并试图以不同的方式了解人,这将是一种全新的艺术,全新的理解人的理论,AI 会试图帮助他们弄清楚他们想要什么。我们还没有想到这些。AGI 可以做任何事情,但我也认为,像未来这样的大多数情况下,可能仍然有很多专业化。
你认为 Midjourney 永远会是垂直产品,还是可以成为一些通用产品?你已经说过你的使命是解决人类的意识想象力问题,不仅仅是关于图片。有一些很有趣的东西,我们正在做社区,如何让一群人一起探索一个很大的空间。我们正在尝试创造这样的事情,在未来的一两年里,Midjourney 可能会成为世界上几乎所有视觉探索的地方,因此我认为有非常有趣的东西。即使我们从未做过其他事情,如果我们只是世界上所有视觉探索的地方,我认为这是一项业务,但我认为我们无论做什么,视觉探索都将适用于其他领域。试图创造这些数百万人的超级思维团队来共同解决问题非常有趣。我不认为任何一个 AGI 能够取代数百万人,但我认为可能会有 AI 参与,可能会有数百万人和数百万个 AI 一起工作,但我认为将有许多代理和许多参与方,我认为每个人的观点都有所不同,这有助于理解问题。许多我们称之为 AI 从业者的人,他们非常担心他们的产品被新的技术所替代。你是否有同样的担心,担心 Midjourney 今天所做的事情有一天会被发展中的 AGI 能力所替代?Midjourney 这样的垂类产品的未来可能是怎样的?找到有价值的东西或值得解决的问题,保持专注,同时保持开放的心态是解决这个问题的一方面。另一方面,创造出来的 AGI 技术或者产品,他们仍然会和我们共同生存在同一个社会里,我们可以用 AI 去不断地创造新的东西,我们可以去定义在这个社会里 AI 要如何和我们协作去创造。现在用视觉方式,在某些方面,它非常原始,但在其他方面,它可能是测试的最佳方式,因为你可以看到一切。你可以真正看到它。而如果我们用诗歌来做这件事,我认为它会同样有趣,但有点难以理解。或者如果我们用引擎或任何其他科学来做这件事,你无法成为科学家,我们找不到 100 万个科学家,但是有 100 万人制作图片很容易找到。因此,这里更多要考虑 AI + 人类整个社会的心智应该是什么样子的问题。现在大多数情况是人类使用 AI 去创造,但我认为在未来,AI 是可以和人共同去思考与创造的,那将会非常的有趣。也许到了某个时候,我们甚至都无法察觉到,一个想法到底是来自于人类,还是来自于 AI 了。
当然,近来对于 AI 安全和各个层面的竞争存在着很多关注和担忧。与此同时,继续扩大和改进当前大模型仍然存在挑战。你是如何看待 AI 领域的未来发展?实际情况是这世上有很多机遇和挑战,甚至可以说有多少问题和挑战就会有多少机遇。我们面对着这么多机会,有时甚至都不需要我们去竞争获得。所以,对我来说,我不会去考虑和谁竞争的问题,这世界上有很多事情需要去做,我只会尽可能地去创造我认为美好和让人惊叹的东西。当我在中国的时候,我发现每个人总是很团结地在协作,从某种角度去看,这种方式和人工智能的原理有些类似。因为它也是一种很社区化的东西,它从我们这里学习,然后它会把从我们这里学到的能力再反馈给我们。这是一种非常社区化和强调协作的方式。我认为竞争有时并不是件好事,有时甚至说「想成为某个方向上最优秀的人」,也在某种程度上违背了技术本身的本质。此外,我们也可以从东方文化中学习很多东西。我所在的地方,人们会担心技术和 AI 是否足够让人感到信任。但另一方面,大家又希望这个世界能够更加智能一些,这样就可以帮助我们去创造和解决更多的问题。我发现在中国的时候,大家会因为你做的创造性的极客事情而认为你很酷,并且因为也想像你一样变得很酷。现在大家都知道 AI 的能力有多强大了,我们就可以去共同努力,为每个人提供基础设施能力,去建设我们的生活环境。
最后一个问题,如果我们展望未来10年的数字世界,你认为今天人类世界中哪些事情不可避免地会发生变化?我认为十年后一个人的创造力可能比当下一群人的都更强大,所以当他们汇聚在一起时,将能做出我们现在无法去想象的事情。大家对未来美好的想象将在某种程度上将每个人紧密地联系在一起,让我们不再害怕未来,而是对未来的到来感到更加兴奋。一个神奇的未来肯定会在前面等待着我们,(我希望)它充满了美好,所以我们带着这样的想法才是最终实现那个美好世界的最佳方式。当然也有一些事情是我不能完全理解和想到的,但(对于10年后的未来)我认为应该就是这样的感觉。未来确实还有很多美好的事情在等着我们让它们发生,同时,我们在往前走时,也要去考虑如何去阻止那些不好的事情发生。今天和你的聊天很有收获,非常感谢你的分享!如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。
Sam Altman 演讲呼吁全人类为即将到来的 AGI 时代做好准备!AGI 的强大能力将从根本上改变人类文明,随着越来越强大的 AI 系统出现,全球合作的重要性前所未有。这意味着我们需要建立极具包容性的国际规范和标准,保障之下,人类将与 AI 合作,在人工智能领域发挥出更大的潜力与灵感。