谷歌为什么输给了OpenAI?科技公司创始人兼谷歌前员工带你一探究竟
新智元报道
新智元报道
【新智元导读】在AI革命的浪潮中,谷歌为什么失去了领先地位?最近,NVIDIA科学家Jim Fan转发了Socratic公司创始人的一篇博客,为我们提供了一个难得的视角来了解谷歌的内部运作。
在当今的人工智能浪潮中,OpenAI这样的新兴公司引领了革命。
——而GPT的一些关键部分:Transformer、强化学习(AlphaGo ) 和 多模态(Flamingo)却都是由Google发明的。
那么为什么,作为科技领域巨无霸的Google,却在如今的群星闪耀中稍显黯淡?
最近,Jim Fan转发了Socratic公司创始人Shryans Bhansali的一篇博客,我们也许可以从Shryans的文字中一窥缘由。
Socratic创建于2013年,主要产品是一款「拍照搜题」的应用,公司在2018年被谷歌收购。
在那个互联网产业空前繁盛的年代,数不清的创业者心怀梦想、雄心勃勃,投身于浪潮之中。Shryans是其中之一,同时也是成功者之一。
而今天,我们谈论更多的,可能是经济形势、市场预期和求职情况。
同样的,当Socratic被谷歌收购,Shryans成为公司员工之后,他又是怎样看待自己的工作,并推进自己的梦想呢?
创业者的独白
2017年,当我们开始为Socratic筹集B轮融资时,我们很快意识到,以牺牲收入为代价来获取使用率的做法会让我们吃亏。
每家风险投资公司都要求我们提供货币化计划,于是我们得出结论,一个专注于没有信用卡的高中生的教育应用不会成为一个大企业。
公司的联合创始人Chris Pedregal曾在谷歌工作过,他重新联系了他过去的经理,我们对一个以学习为中心、由人工智能驱动的家庭教师的愿景是完全重合的。
也许是因为我们刚刚赢得了谷歌2017年度「最佳应用」,那次会面后不久,我们就启动了一个流程,最终,谷歌在2018年3月收购了Socratic。
我们与现有的一个同样规模的团队合并,该团队由多名长期在谷歌工作的人员组成。Chris和我成为产品和工程负责人,负责打造人工智能驱动的辅导员,并将这些功能引入谷歌最大的产品中。
在接下来的三年中,我们重建了Socratic,将其重新命名为 「Socratic by Google」,并且在搜索和Lens中提供了Socratic功能,还发布了数学求解器和逐步数学辅导原型等功能。
在谷歌工作
一路走来,我学到了一些东西:
在谷歌工作就像拥有了第二本护照。到世界上任何一个大城市,你的胸卡都能打开一个漂亮的办公室,里面有美味的食物、办公桌,还能高速连接谷歌20多万人网络中的每一个人。
包括访问他们的巨型monorepo,其中包含数十亿行代码,几乎涵盖了他们所有的产品。遍布全球的数据中心的实时状态。跨越二十年历史的战略文件。
谷歌以谷歌的方式做事。谷歌使用的几乎所有软件和基础设施都是在谷歌建立的,这是比大多数公司更早面对最棘手的工程问题的自然结果。
在谷歌这样的规模中,外部世界已不复存在,只有在极少数情况下,才会被小心翼翼地允许进入他们的围墙。
这意味着我们不可能保留现有的代码库。我们需要从头开始,与新团队一起重新开发我们的产品,然后在谷歌的堆栈上重建我们的应用程序。
我们的应用程序吉祥物 「Ceebo」打破了谷歌的固有模式。看看谷歌的应用程序图标集,你会发现只有四种颜色和简单的形状。这对他们来说是可行的,但对我们来说却是无趣的。
他们反对(「我们不会拟人化」),我们也反对(「你们安卓系统就会拟人化!」),直到最后我们终于如愿以偿,因为我们太小了,根本不重要。
Ceebo作为我们的应用程序图标继续存在,并在谷歌内部绽放光彩,谷歌已经为其设计了数十种变体,Ceebo也出现在谷歌的文档和网站中。
简单的事情重复做就会感觉很神奇。与搜索领域的资深人士一起重新构建我们的查询分类系统,让我们对搜索本身的构建过程有了更深入的了解。
一方面,信息检索工具的深度令人难以置信,而计算并为互联网上的每个页面添加新信号的能力也令人匪夷所思。
另一方面,我们发现大多数搜索改进都是由工程师通过「并排」比较新旧结果......在电子表格上进行人工审核的!
人们可能会认为谷歌的工程设计主要是实现博士级的算法,虽然有时确实如此,但搜索或人工智能工程师的大部分工作都涉及查看示例、发现模式、手工标注数据以及在杂乱的数据中进行分析。这似乎是最优秀的人工智能团队的普遍真实写照。
我注意到的一个模式是,优秀的人工智能研究人员愿意手动检查大量数据。不仅如此,他们还建立基础设施,使他们能够快速手动检查数据。手动检查数据虽然并不光彩,但却能为问题提供有价值的直觉。
大多数1000万至5000万用户的问题都不值得Google花时间,也不符合他们的战略。但对于那些符合其本质、战略和某人推广目标的问题,他们会花大力气去解决。
其中一个例子是:计算机视觉是Socratic界面的重要组成部分,特别是能够读取图像中的文字和数学。
作为一家初创公司,我们使用了第三方工具,但在谷歌内部使用该工具太困难了,因为会暴露敏感数据、对规模的期望以及复杂的供应商审查流程。
有时,收购一家公司将技术引进公司内部会更容易。还有一些时候,就像我们的情况一样,雇佣了一个顶尖的博士人才来研究这个问题,并在6个月内提供了一个世界级的数学识别API。
谷歌是一个目标和努力不断变化的网络。在谷歌,只要有合适的人关注,就有可能实现令人惊叹的成就。
一个能理解的副总裁,一个有相关章程的研究团队,或者一个与组织目标相匹配的人。处理好这些混乱的利益关系是项目经理的一半工作。然后,你还需要得到隐私、信任、安全和基础设施等审批者的支持。要知道一个想法是否可行,需要数十次对话,而要实现它,则需要数百次对话,但这个过程是快乐的。
团队目标在任何一个季度都可能发生变化,整个团队也可能在重组中消失,这种现象如此普遍,以至于谷歌人可以透过悲剧看到喜剧。
假设你解决了所有这些问题,一觉醒来,你可能还是会发现,当你在为自己的项目工作时,两个遥远的团队也在为同样的想法工作,现在到了一决雌雄的时候了,因为只有一个团队可以继续工作。
Googler们想做伟大的工作,但往往做不到。毫无疑问,有些人是为了吃饱饭,每天工作3小时,然后享受提前退休的待遇,但我遇到的所有人都是认真、勤奋、想做伟大工作的人。
打败他们的是审查的重重关卡、频繁的重新修订、过去失败留下的制度疤痕,以及在世界舞台上做简单事情的复杂性。初创公司可以忽略很多问题,而谷歌人却很少能做到。
人本身也是一个问题——所有聪明的人都能反驳任何事情,却不能支持某件事情;所有领导者都没有勇气说出令人不舒服的真相;所有被雇用的人都没有明确的工作项目,但仍然必须通过有晋升价值的虚构工作来留住他们。
头重脚轻的组织很难引导:一个由多名成功的联合创始人和在谷歌工作了10-20年的资深员工组成的团队,听起来可能是成就大事的秘诀,但也是陷入僵局的秘诀。
如果有多个领域需要探索,有明确的目标,并且有很强的自主性去追求这些道路,那么这种结构可能会奏效。
但如果你想开发一个统一的产品,就需要有一个明确的领导者,明确的方向,以及更多的实践者而不是思考者。与直觉相反的是,为早期项目增加人手并不会让项目进展得更快。
另外,技术债务是真实存在的。优秀的团队会定期在平静的日子里清理工作,从而偿还债务。
流程债务也是如此:因为发布出错而增加的审查、为防范可能的诉讼而新增的法律检查、在文档模板中添加一个部分。多年来,层层累积,直到一项新功能准备就绪数月后仍无法发布,因为它被卡在审核之间,出路不明。
谷歌最近改变了他们繁琐的绩效考核流程,从一年两次改为一次,问卷从长变短,希望能从占经理一年30%以上的时间减少到10%以下。
有时,外部威胁会迫使公司做出改变,或者促使公司走向衰落。谷歌发明了ChatGPT背后的技术,却并不是发布该产品的公司。现在,谷歌希望重新夺回在人工智能领域的领先地位,同时还需要防范一切可能的麻烦。
谷歌的「游戏」
谷歌曾经有一套内部价值观,他们称之为 「三个尊重」:尊重用户、尊重彼此、尊重机会。前两个很容易理解,但第三个却让大多数人感到困惑。
我的解释是:你在谷歌,这是一家利润丰厚、充满天才的企业。你收入丰厚,衣食无忧,生活在永恒春天的天堂硅谷。在这种疯狂的运气下,你能做的最好的事情是什么?
——你必须找到自己领域中最重要的问题,并不惜一切代价去解决它。
实际上,这意味着首先要完成交给你的工作。一旦这些工作都在掌控之中,你就必须深入到庞大的谷歌网络中,了解正在计划和发明的东西,凝聚一个清晰的未来形象,通过文档和演示使其成型,找到目标与这个形象一致的领导者,并尽可能坚持不懈地推销你的想法。
曾经,我们三个人花了几个月的时间,在新的数学求解器基础上制作了一个循序渐进的数学辅导演示。这个演示为我们的智能辅导愿景提供了一个具体的形式——它有一个链接,可以使用,可以分享。它使对话接地气,让人们做出一些具体的反应,并在我们团队之外传递,独立讨论,然后引导我们。
许多收购都以失败告终。Socratic的故事喜忧参半。一方面,我们成功地融合了两种截然不同的文化,我们的产品得以延续,并发展到每年为约50亿次查询提供服务,Socratic团队的事业也得到了蓬勃发展。
另一方面,Chris和我都离开了谷歌,创办了创业公司,而无论是Socratic团队还是整个谷歌,都还没有开发出与谷歌能力相匹配的人工智能辅导工具。不过,几个Socratic团队的谷歌员工可能会让它成为现实。
微信扫码关注该文公众号作者