来源丨赛博禅心(ID:gh_520ee42749ed)
从开发者必备的 GitHub,到年轻独角兽 Scale、Cohere,再到今年备受瞩目的 Character.ai,当我在研究人工智能领域的优秀公司时,常看到两个名字赫然在「早期投资人」之列 —— Nat (Nathaniel) Friedman 与 Daniel Gross。PS:以下补充两张图,分别是 Nat Friedman 和 Daaniel Gross 至今个人投资过的 AI 项目汇总,以及 AI Grant 的创业顾问/讲师阵营。投资过的AI项目汇总从 2017 年开始,Nat 与 Daniel 也开始了在人工智能领域的搭档投资,并成立了一家名为 AI Grant 的机构。从最初的学术研究资助基金,到如今成为一支早期风险投资基金,AI Grant 的运营与投资模式在「如何做对创业团队更有帮助的人工智能领域早期投资者」方面为我带来了不少灵感与启发。在这里,也希望将 Nat 与 Daniel 的成长与投资故事分享给大家。爱因斯坦曾是一名在伯恩工作的专利职员。他有许多在大家看来很疯狂的想法。两位主角
「It's hard to imagine myself doing something other than founding a startup. But you never know. I'm open to anything.」在个人网站上,Nat (Nathaniel) Friedman 的自我介绍中有这样一句话:「 我 1991 年开始上网,互联网是我真正的家乡」—— 他并没有夸张。出生于 1977 年的 Nat Friedman 六岁便学会了软件开发。1991 年,大洋彼岸的芬兰年轻人 Linus Torvalds 公开发布了 Linux,刚刚开始上网的弗吉尼亚小镇少年 Nat 很快发现了它,并凭借聪明的大脑与无限的好奇心成为了 Linux 社区的知名黑客 —— 开源社区由此成为了他职业生涯的起点与亲密友谊的基础。1999 年,Nat 从 MIT 计算机与数学系顺利毕业,22 岁的他有一个坚定的信念:只想在开源领域工作。因此,即便一贫如洗,他依然拒绝了所有的工作邀请,偷偷住在 MIT 宿舍公共休息室发臭的红色旧沙发上,只因为那里的网速很快。好在自由软件基金会(Free Software Foundation)的 Tim Ney 及时伸出援手,为 Nat 开了一张 350 美元的支票,表面上是为了让他搭建基金会的办公系统,实际上没要求他做任何事 —— 那么 Nat 到底用这笔钱做了什么?时间回到 1996 年,还是大学新生的 Nat 在自己编写的 IRC[1] 网络 LinuxNet 上认识了从数学系退学并全心投入自由软件开发的墨西哥青年 Miguel de Icaza。随后的 1997 年夏天,在 Microsoft 实习的 Nat 与前来面试 Internet Explorer Unix 团队岗位的 Miguel 正式结识。但是,由于没有大学学位,无法获得工作签证的 Miguel 并没有入职 Microsoft,而是在同年 8 月与朋友共同发起了开源项目 GNOME。1999 年 4 月,毕业前夕的 Nat 向 Miguel 提议创建一家公司来继续 GNOME 的开发,但他们没钱 —— Tim 的支票帮了大忙。1999 年 10 月,Nat 与 Miguel 共同成立了 International GNOME Support(后称 Helix Code),开发 GNOME 的基础设施和应用程序,最终这家公司更名为 Ximian,并在 2003 年 8 月被 Novell 收购。在回顾第一段创业经历时,Nat 和 Miguel 写道:「Ximian 是由志同道合的朋友组成的,我们创办公司时没有任何创业、管理或商业经验,我们在工作中学习,也得到了相信我们目标和关心我们使命的朋友的建议;Ximian 90% 的员工是开源社区贡献者和我们通过邮件或 IRC 认识的人;我们没有管理经验,这意味着我们犯了教科书中所有可能出现的管理错误,但在我们学习和努力让公司起步的过程中,所有朋友和员工都支持着我们。」加入 Novell 后,Nat 负责公司所有 Linux 相关的项目并担任开源项目 CTO,让 6,000 多名员工摆脱了 Windows 系统与 Office 套件的束缚,转向了开源的 SUSE 与 OpenOffoce。2007 年,Nat 搬到了慕尼黑,发起了 SUSE Studio 项目,并在 2009 年产品推出后离开了这家公司,那时他也刚刚结了婚,是「一个自然的突破点和寻找新事物的时机」。从这段经历来看,大公司的工作模式并没有消解 Nat 的创造力之魂。在 Nat 离职后不久加入 SUSE 的 David Majda 在博客中这样写道:「这个应用程序看起来很现代,视觉呈现令人感到愉悦,并且易于使用。它看起来完全不像是一家 Linux 公司的产品,更像是一家初创公司的产品。SUSE 可以创建如此一流应用程序的超脱能力说服了我加入该公司并最终加入 SUSE Studio 团队。…… 加入 SUSE 后,我很好奇搭建这个产品的秘诀是什么,很快就偶然发现了 Nat Friedman 的名字 —— 整个项目显然是他的主意。他说服了管理层,组建了一支由他能找到的最好的开发人员组成的团队,以初创公司的方式运行它,并在两年多的时间里搭建了该产品。请记住,这是一家大公司,一面要面对 Novell 大公司风格的管理者,一面要面对 Linux 社区的铁杆黑客 —— 这可不是件容易的事。」2010 年,Nat 与新婚妻子开始了环球旅行,在开始这趟旅行前,他说:「当我们旅行结束后,我的下一步很可能是在美国创办一家公司。很难想象除了创办一家初创公司之外,我还能做什么 —— 但我不知道自己具体会做什么,我对任何事情都持开放态度。」没过多久这趟旅行就停止了 —— Novell 在 2011 年 4 月底被 Attachmate 收购,5 月初,Miguel 所领导的团队也被解散了。Nat 回到美国,半个月后的 5 月 17 日,执行力惊人的二人再次合作成立了 Xamarin,继续运行被 Attachmate 放弃的开源跨平台 SDK Mono 项目,2016 年,这家公司以约 5 亿美元的价格被 Microsoft 收购。加入 Microsoft 后,Nat 还是想坚持做「创业者」,一开始,他准备一两年后就离开并开始花时间忙自己感兴趣的「副业」。在职期间,除了发起本文随后要详细介绍的 AI Grant 项目,他还创立了加州 YIMBY (Yes In My Back Yard),致力于解决加州住房短缺问题。但不久后,他便发现,Microsoft 新任 CEO Satya Nadella 是一个值得学习的领导者 —— 一位开放且总在追求更高目标的管理者。2017 年,Nat 给 Satya 发了一封邮件,提议收购 GitHub —— 尽管 Nat 刚入职不久,但 Satya 依旧在一周后就将这个史上最大规模的与开发者相关的收购案,也是 Microsoft 当时最大规模的收购案,全权授权给了他。2018 年,Microsoft 在质疑声中收购了 GitHub,任命了「让开发者最放心」的 Nat 作为 CEO。在上任第一天,Nat 写道:「我不会请求大家的信任,而是致力于赢得大家的信任。」结果没有让大家失望:他不仅让平台保持了独立性与中立性,在开发者社区赢得了良好声誉;打造了明星产品 GitHub Copilot,让 GitHub 的影响力持续扩大;还收购了 NPM、Semmle、Dependabot 和 PullPanda 等六家公司,让营收和用户良性增长,最终向 Microsoft 交上了一份不错的答卷。其中,不得不提的是 GitHub Copilot 的打造历程 —— 这亦是 Satya 与 Nat 高效协作的最佳呈现。2020 年 6 月 11 日,OpenAI 发布了 GPT-3,其本身的能力以及相关的演示让 Nat 大为震撼,并决定一定要立刻围绕这个模型做些什么。但当时,他也不知道它能用来做些什么。好在极富远见的 Satya 早已和 OpenAI 建立了合作关系,这给了 Nat 充分的空间在不确定性中进行探索。很快,Nat 在 GitHub 社区找到了几位出色的开发者,带着「如何让一个经常出错的模型有用」的问题,大家开始沿着两个方向进行探索:聊天机器人与代码生成。两个月后,他们发觉,GPT-3 直接应用于聊天场景还不行 —— 过大的模型带来了过高的延迟,用户很难真正喜欢这样的聊天对象;而次年 2 月开始开发的 Copilot 则是另外一种思路,它像一个坐在用户肩上的「小助手」,与用户一起解决问题,不定时出现,帮助用户修补代码,甚至生成完整的功能 —— 就像一个随机中奖的老虎机,让用户觉得有用的同时,还有点上瘾 —— 2021 年 6 月 29 日,GitHub Copilot 正式发布了,随后受到了数以百万计的程序员的喜爱。2021 年 11 月 3 日,Nat 给 GitHub 团队发送了一封邮件「我正在继续我的下一段冒险:为正在用技术创造未来并抓住一些大机会的创始人和开发人员提供支持、建议和投资」,就此成为了一名全职投资人。「The most surprising part of the experience was how much it meant for someone to believe in me.」在 Nat Friedman 开始上网的 1991 年,Daniel 出生了,他在耶路撒冷度过了人生的前十八年,直至高中毕业。在家乡,Daniel 一直认为自己是个「局外人(outlier)」,他没有什么朋友,对生活种种也毫无热情,但编程是个例外 —— 这是他唯一热爱的事,因为在程序的世界里,他可以获得最大程度的自由,做自己想做的事 —— 唯一的限制便是想象力。2009 年,高中毕业后的 Daniel 考入了以色列著名的预军事学院 Bnei David Academy,但依然没有找到兴趣相投的朋友和自己的人生目标。没过多久,Daniel 的父亲转发了一篇关于硅谷的创业项目 Y Combinator(YC)的文章 —— 那时,这家未来全球最成功的创业加速器刚刚决定专注于在硅谷投资,并完成了首次对外募资,但重要的是,这个 18 岁的男孩发现,也许 YC 就是他一直在寻找的「局外人」聚集地 —— 于是,在荒凉的以色列军营中,他用老式的诺基亚手机与笨重的笔记本电脑,完成了 YC 的申请,由此解锁了一段「旋风般的人生旅程」。2010 年,Daniel 顺利通过 YC 面试,抵达硅谷(*由于「逃避」服役触犯当地法律,Daniel 此后再未返回以色列),创办了一家名为 Greplin 的公司,开发个人助理应用产品 —— 也正是在 YC Demo Day 上,Nat 注意到了这个特别的年轻人。随后,Greplin 获得了来自红杉资本等顶级投资机构的两轮投资,更名为 Cue,并在 2013 年以约 4000 万美金的价格被 Apple 收购,Daniel 此后也成为了 Apple 的技术总监,负责机器学习与搜索业务 —— 而这时 Daniel 才刚满 23 岁,一切都发生得如此之快。从 YC 与红杉当时所支持最年轻的创始人到被 Apple 收购,Daniel 深信,成功的第一步是找到一个由「局外人」组成的社区,第二步则是找到敢于为默默无闻的「局外人们」下注的人,即早期投资人。于是,Daniel 开始了对早期投资领域的探索,从 2013 年开始,他以个人投资者的身份陆续投资了 Uber、GitHub、Coinbase、Instacart、Opendoor、Airtable、Figma、Gusto、Notion、Cruise 等公司,这着实是个称得上亮眼的成绩单。但 Daniel 正式走上早期投资之路还是在 2017 年 1 月 —— 他辞去了其他所有职务,以合伙人的身份重返 YC,不仅投资于人工智能领域,也将人工智能技术融入了这家机构的工作流程中;同年 7 月,他加入 Nat Friedman,共同领导 AI Grant 项目;2018 年 8 月,他离开 YC,成立了 Pioneer,旨在帮助来自世界各地的弱势创业者(underdogs)快速启动项目,从而找到更多「失落的爱因斯坦 [2]」。
AI Grant,怎么投?
2017 至 2022 年 -「分布式人工智能实验室」
2016 年 3 月,AlphaGo 在比赛中打败了人类顶级围棋选手李世石,随即而来的 2017 年,便是著名的「深度学习框架之年」,人工智能领域的研究、产品、创业、投资活跃空前,影响深远的论文 Attention Is All You Need 也正是在这一年发布的。但是,当时的技术普遍距离真正产生商业与社会价值较远,基础学术研究看似方向繁多,实则内卷且不接地气。2017 年 4 月 12 日,伴随着行业热潮与问题,aigrant.org 上线了。最初只有 Nat 一个人来运营整个 AI Grant 项目,他的想法很直接:像 Tim 一样,为如当初的自己一般「睡在发臭的红色旧沙发上的人」提供实现梦想的机会。项目的申请方式非常简单:填写一份申请表,通过筛选即可获得 5,000 美元资助(最初名额只有五个),用以进行开源人工智能技术相关研究。整个过程仅需几分钟的填表时间,这便是 AI Grant 1.0 版本。那么,为什么选择「开源人工智能技术」呢?当时的 Nat 确信以下两点:第一,开源是无数产品与想法的基础,这些产品和想法最初都是从创作者通过互联网获取免费代码开始的。在开源被普及前,创造新事物的第一步意味着构建或购买基准基础设施,而随着一个又一个新开源项目的出现,入场价格会不断降低,趋近于零;
第二,人工智能将成为未来无数新产品、想法和公司的基础,从汽车到医药到金融再到教育,人工智能将推动各行各业的巨大创新浪潮。而结合第一条,开源人工智能技术将降低入场成本,让更多的,甚至任何人都可以参与其中(但仍然需要为 GPU 付费)。但至于什么是人工智能,以及什么是人工智能技术相关的研究,Nat 保持了一贯的开放态度 —— 任何感觉像人工智能或对领域有贡献的东西 —— 正如当下我们无法定义什么是「人工智能原生产品(AI-Native Product)」一样,彼时也没有人可以定义什么是「人工智能」。2. 是特别关注那些看起来无法通过其他方式获得资助的项目。显然,愿意资助年轻人未来的人不只有 Tim 和 Nat。AI Grant 计划公布后六天,早期基金 Floodfgate 的创始合伙人,也在 Stanford 任教的 Ann Miura-Ko 加入并提供了额外五个名额。她希望通过这个资助计划找到「原动力」类型的人,即从开源项目入手,未来会进行不同类型的探索,甚至创业的人。- Microsoft 将为这十位被资助者提供 1,000 美元可兑换 NVIDIA Tesla K80 虚拟机的 Azure 额度;- FloydHub 将提供 250 小时 NVIDIA Tesla K80 托管时长,Scale 提供了 1,000 美元的人工数据标注额度,CrowdFlower 也提供了 5,000 美元的人工数据标注额度。—— 这不仅仅是所得资助价值的增加,实际上,资助的内容也变得更为实际、更易分配且更多样化了。
AI Grant 的首次招募大获成功,Nat 收到了来自 50 个国家的近 500 份申请,有 20 余位专业的志愿者与他一起进行项目筛选,并最终在一个月后选出了十位候选人。2017 年 6 月,一直在探索如何投资于「默默无闻的局外人」的 Daniel Gross 正式加入 Nat,成为了项目合伙人并将项目定位为「分布式人工智能实验室」,AI Grant 迎来了又一次迭代:- 提供基础设施的科技公司增加了资助额。在上一期的基础上,Google 替代了 Microsoft,将为每位被资助人提供 20,000 美元的虚拟机服务额度;- 「人际网络」的参与度上升。除了两位捐助人,时任 Tesla 人工智能总监的 Andrej Karpathy 与来自 Google 的研究人员一起,组成了 AI Grant 专家小组。同时,正如我们前面所提 到的,有不少专业的志愿者申请加入了 Nat 的筛选团队,他们也成为了 AI Grant 人际网的一部分,与专家一起,为被资助的研究人员提供帮助;- 而尽管有了早期基金 CRV 的加入,初始现金的发放金额还是降低了。对于一个早期项目来讲,学会规划资源,「花小钱,办大事」十分关键 —— 2,500 美金是当时的大多数研究人员所需的启动资金。
此后,AI Grant 的资助模式就在此之上不断迭代更新,与 Pioneer 所投资的创始人类似,这里的被资助者背景也极为多样,从非洲到美国,从高中生到研究员 —— 虽然之后一度因为人工智能行业遇冷而只得零散发放。
截至 2022 年,AI Grant 共资助过 50 余位研究人员,其中通过两次筛选得到全部现金资助的共 36 位。他们中有不少也创建了自己的公司,其中的两家成为了独角兽,分别是当前估值 22 亿美金的大语言模型公司 Cohere 与 16 亿美金的智能呼叫中心公司 Cresta,另一家视频数据实时处理公司 Helia 也成功被 Scale 收购。Helia 的创始人 Russell Kaplan 是第一批 AI Grant 的获得者,当时他即将从 Stanford 研究生毕业,正在研究用自然语言引导强化学习,构建并开源了一个学习速度更快的深度强化学习代理(agent),并在蒙特祖玛的复仇(Montezuma’s Revenge)[3] 中击败了大多数其他方法。毕业后,他最初选择加入了 Tesla,并打造了 Tesla 核心视觉模型,大规模多任务神经网络 HydraNet,但不到两年后,他便与来自 Palantir 的 Ashwin Sreenivas 以及来自高盛的 Daniel Berrios 共同成立了计算机视觉公司 Helia,旨在进行视频信息数据的实时处理,并在次年底出售给了 Scale。同年第二批被资助的 Cohere 创始人 Aidan Gomez 与 Ivan Zhang 是多伦多大学的校友,当时他们的研究项目十分硬核 —— 使用生成对抗神经网络进行密码破解 —— 这在当时的 1,000 余位申请者中是十分亮眼的存在。在 AI Grant 的支持下,两人成立了 For.ai 做相关研究,两年后,刚刚前往牛津大学读博的 Aidan(2023 年毕业)与从多伦多大学本科辍学的 Ivan 共同成立了 Cohere,当初的 For.ai 如今已成为 Cohere 内部的非盈利研究中心 Cohere For AI(*顺便说一句,就在今年 AI Grant Batch 1 成员公布的一天后,Cohere For AI 也开启了自己的人工智能研究资助项目)。而其中最晚接受资助的巴基斯坦移民 Zayd Enam 16 岁就曾在家乡尝试互联网医疗创业,接受资助不久后,他便从 Stanford 博士辍学,与彼时刚刚博士毕业加入 OpenAI 一年的 Tim Shi 开始了创业之旅,成立了 Cresta。2022 年,人工智能热潮再度来临,与上次不同,领域内的学术研究已然丰富多彩,而相关的用户体验和产品创新才刚刚开始。在一次采访中,Nat 说:「我和 Daniel 花了几年的时间玩 GPT 模型并被它们的能力所震撼,我非常幸运地设计并发布了 GitHub Copilot,在那之后,我就期待有一系列的新产品 —— 因为也许会有更多人经历同样的过程,发现 GPT-3 可以做许多不可思议的事,然后思考能否在不同产品中加入这一能力 —— 但这并没有发生。所以到 2022 年夏末初秋,我们开始问自己,人们去哪里了?这就是为什么,我们重新启动了 AI Grant,呼吁开发者们开始行动。」2022 年 8 月 31 日,AI Grant 再度重启,出手也「阔绰」了很多,每位被投资者将获得 250,000 美元的现金投资。值得一提的是,虽然与诸多科技公司合作,始终被 Nat 放在宣传位的只有 Microsoft Azure 的云计算额度 —— 从「开源人工智能技术」到「AI-first 产品」再到「AI-native 产品」,从研究人员到创业者,绕不开的始终是 GPU 成本。2022 年 Nat Friedman 的宣传 图源:Twitter2023 年 Nat Friedman 的宣传 图源:Twitter其实,从 2020 年开始,虽然 Nat 与 Daniel 依旧是以个人投资者名义出现在各公司的投资者列表中,但他们早已悄悄募集了一支总额约 11 亿美金的风险投资基金 C2 Investments 及另外两支总额约 1.42 亿美元的小基金 CTRY 与 ND2100,并通过它们投资于人工智能与基础设施相关的初创公司。而 AI Grant 作为两人投资策略的一部分,也正式完成了由非营利组织到风险投资机构的转变,致力于投资更早期的 AI-Native 产品。作为人工智能垂直领域的早期投资人,Nat 与 Daniel 的投资策略更加务实,他们在基础设施的搭建与支持上下足了功夫:- 2023 年初,Nat 搭建了 nat.dev,一个聚合了市面上几乎所有常见语言模型的平台,可以方便地试用并对比不同语言模型;- 2023 年 6 月,Nat 与 Daniel 收购了 2,512 个 NVIDIA Tesla H100 服务器芯片(价值约 1 亿美元,约为 NVIDIA 内部超级计算机规模的一半),组成了仙女座集群(Andromeda Cluster)并将对他们投资的初创公司开放 —— 这意味着,这些小规模的初创公司将获得资金雄厚的大公司才有能力获得的计算资源。
AI-Native 怎么投,投什么?
一个基础的问题:Nat 与 Daniel 如何定义,又如何筛选 AI-native 产品?作为重要参考,AI Grant 官网给出的答案如下:「任何以有用或有意思的方式利用人工智能模型的产品。特别是,我们正在寻找能够打造出色产品的技术和务实的创始人。如果您因制作他人喜欢使用的东西而感到兴奋,并且了解构建新产品只需要 1% 的想法和 99% 的迭代,那么我们希望为您提供支持。」「任何以有用或有意思的方式利用人工智能模型的产品」—— 两位再一次保持了开放性。其实,虽然没有明确范围,但从两人的访谈、项目投资、AI Grant Batch 1 成员甚至此前发起的「维苏威火山挑战赛」中,他们对于人工智能产品的偏好,甚至技术使用的态度可见一斑。- 创始人 - David Hsu,2017 年本科毕业于牛津大学哲学与计算机专业- 投资时间 - 2017 年(至 2022 年连续押注 5 轮)- 其他投资人 - Patrick Collison、John Collison、Elad Gil、YC、Sequoia 等- 创始人 - John Carmack,1990 年联合创办 id Software,任《Commander Keen》、《德军总部 3D》、《毁灭战士》、《雷神之锤》及其续作的首席程序员;2013 年加入 Oculus,任 CTO- 其他投资人 - Patrick Collison、Tobi Lutke、Sequoia、Capital Factory- 创始人 - Piotr Dabkowski,2016 年本科毕业于牛津大学工程专业,2017 年研究生毕业于剑桥大学计算机专业;2022 年离职创业前为 Google 苏黎世软件工程师。Mati Staniszewskiv,本科毕业于英国帝国理工学院数学系,2022 年离职创业前为 Palantir 部署策略师- 其他投资人 - a16z、SVA、Guillermo Rauch 等- 创始人 - Sharif Shameem,2019 年毕业于马里兰大学,同年成立 P2P 云游戏公司 Vectordash;2022 年成立语言模型驱动的低代码工具公司 DebuildAI Grant Batch 1 的 26 个成员Batch 1 成员企业不仅产品方向多样,创始人的背景也十分多元,既有刚刚本科毕业的年轻人(Flair、WOMBO),也有经验丰富的连续创业者(Replicate、Chroma)。这些出色产品中的大多数我们已经在前面的 Newletter 中介绍过,由于文章篇幅,在这里不再对每一个企业进行详述,仅列出一句话简介与网址:Chroma - 开源嵌入数据库(更通俗地讲,可编程的内存)🔗 https://www.trychroma.com/🔗 https://www.perplexity.ai/ValueBase - 面向政府的资产估值模型工具🔗 https://www.valuebase.co/🔗 https://www.gosameday.com/🔗 https://www.ghostwrite.rip/Samaya AI - 面向金融服务的知识发现平台🔗 https://www.forefront.ai/Circle Labs - Discord 联系人生成🔗 https://circlelabs.xyz/ (网站极为简陋,但我真的很喜欢!!)🔗 https://www.recraft.ai/Flair - 品牌内容设计(主要是产品与模特图)工具WOMBO - 面向消费者的对口型(Lip Sync)视频生成工具Sieve - 视频加工、理解与搜索 API 云平台🔗 https://www.sievedata.com/Secret Weapons - 面向电影行业的视频工具🔗 https://www.pixelcut.ai/AniML - 基于 NeRF 的产品视频生成工具Animato(Call Annie)- 与虚拟角色视频聊天Minion.ai - 自动化浏览器助手(产品暂未发布)
🔗 https://minion.ai/
维苏威火山挑战赛 - 面向人类文明的人工智能
如果说风险投资基金以及 AI Grant 是 Nat 与 Daniel 为用人工智能促进商业世界的进步而进行的投资,那么二人与肯塔基大学计算机科学教授,也是 scrollprize.org 联合创始人之一的 Brent Seales 在 2023 年 3 月共同发起的维苏威火山挑战赛(Vesuvius Challenge)就是他们为用人工智能促进人类文明的发展而进行的探索。挑战赛要求参赛者阅读公元 79 年维苏威火山喷发后被埋在 20 米深的泥土和火山灰下的两个已经被碳化了的未展开的卷轴(赫库兰尼姆纸莎草纸卷)中的四个段落,这无疑是一项艰巨的任务。该竞赛是以第三位发起人 Brent Seales 已完成的工作为基础的,早在 2015 年,他和他的团队就使用 X 射线断层扫描和计算机视觉「阅读」了在以色列死海地区以碳化状态发现的恩戈迪卷轴 —— 在没有打开它的前提下呈现了其中包含的《圣经》文本。但,阅读赫库兰尼姆纸莎草纸中的内容更具挑战性:与恩戈迪卷轴中使用的较稠密的墨水不同,赫库兰尼姆墨水是碳基墨水,莎草纸则是碳基纸,两者在 X 射线下不会形成对比。与此同时,这项任务对人类历史研究的意义也同样巨大 —— 实际上,如果我们可以将现有的 1,814 卷卷轴与碎片完全展开并阅读,人类所拥有的古代文学作品的数量也许将增加一倍以上。只是,之前大量不合理的展开尝试已经损毁了其中的许多,除了一位意大利僧侣花费数十年时间精心展开并整理的部分希腊语哲学卷轴,还有 600 余卷未曾被展开。根据比赛官网,100 万美元的大奖将授予第一个在 2023 年 12 月 31 日太平洋时间晚上 11:59 之前使任何一个完整扫描的卷轴可读的团队 —— 提交的内容必须以虚拟展开纸莎草图像的形式呈现,文本可见且清晰,并且需要附有解决方案如何复现并可行的详细技术描述。但是,比赛还有一个附加条款:「降低幻觉」。如果团队的模型存在任何产生幻觉结果的风险,需要说明实操过程中如何降低该风险,并论证为何提交者本人确信自己得到的结果是真实的。这无疑是一个利用新技术解开人类古老秘密的好机会。除了纷至沓来的参赛者,不断攀升的捐助额也为我们展现着各个群体对于利用新技术推动人类文明发展的热情:在任务发布的几天内,包括 Stripe 创始人 Collison 兄弟、Shopify 创始人 Tobi Lutke、Wordpress 创始人 Matt Mullenweg 在内的近二十位企业家、投资人及匿名人士纷纷加入捐赠者之列,比赛奖金也随之翻了四番👇
另外,值得注意的是,即便是在比赛中,Nat 与 Daniel 也在倡导着根植于其内心的开源精神。比赛官网写道:「维苏威火山挑战赛的所有组织者都坚信开源和渐进式进步。我们希望鼓励开放式建设并使整个社区受益 —— 而这在竞争中通常会受到抑制。」因此,比赛额外特设了三项价值 2,000 美元的开源奖。2023 年 3 月,在接受 Ben Thompson 的采访时,针对 AI-native 产品的发展周期,Nat 提出了这样的观点:由于网络基础设施已经十分成熟,AI 产品的扩散速度会倍速于上一代互联网产品,但我们依然需要时间弄清楚真正的 AI-native 产品是什么样的,而不仅是改进现有的工作流程与软件。他的几个有意思的具体表述如下(*我不认为任何人可以预测两年及更长时间维度后的未来,这里仅作观点参考):- 即便研究人员止步于此,不再进行功能迭代与增加,我们也需要五到十年的时间消化 GPT-4 和其他先进模型的能力,并将其转化为产品。有太多的变化与变体、工作流程与用户体验需要被发明、被重新发明或排列组合,而我们才刚刚触及表层,只是在尝试把这些能力捆绑到现有产品中。
- 操作系统需要围绕人工智能的能力进行重建。不同的初创公司已经分别证明了人工智能可以拥有不同的超现实能力,我们可以用十年时间重建整个计算平台。现在领域内的状态是研究人员走在前面,商业层面还有很多消化工作要做,而且这个过程很难加速。- 人工智能的能力不会止步于此,它们会继续发展,过去两年里的发展态势很可能会持续下去,这些都是大的台阶式的进步。所以,即便我们确实为 2023 年的人工智能能力进行了原生产品设计,2024 年同一时间可能也会发现所面对的是完全不同的能力与工具 —— 这是一波全新的技术,需要时间消化为产品。
基于此,他也提出了一个问题:如果脚踩的土地(基础设施)一直在快速变化,我们选择在哪里下注?他的回答是这样的:现在要想真正在人工智能领域出类拔萃,必须要有对其有更深刻的理解。与十几年前不同,创业现在已经是一件非常普遍的事,硅谷的选择效应正在降低,池子里有了更多人,选择好方向就更难了,尤其是人工智能当下是如此热门的方向,对于任何创业者来说,在这个方向创业都会难上加难。
但不要太悲观 —— 我们是什么时候真正意识到互联网已经成为了一个产业的?泡沫破裂之后。