【新智元导读】市值140亿美元的初创公司Scale AI正在招聘博士训练LLM,用人成本的升高让该公司的毛利率在2023年有所下降,但创始人Alexandr Wang预计今年营收将增加两倍,突破十亿美元。
上个月,由27岁华裔天才少年Alexandr Wang创办的Scale AI获得10亿美元巨额融资,估值飙升至138亿美元,获得了广泛关注。创始Alexandr Wang19岁就瞄准了数据标注这一风口,毅然辍学创业,如今坐拥全球AI数据铸造厂Scale AI,这位「全球最年轻的白手起家的亿万富翁」和他身后的明星公司都十分令人瞩目。根据The Information最近的独家报道,Scale AI正在招聘博士训练LLM,让他们灵活办公,开出高达40美元的时薪。
数据标注的门槛已经这么高了吗?过高的劳动力成本是否会让Scale AI烧掉融资?
劳动力聘用标准转型
Scale过去主要雇用非洲、印度和菲律宾的廉价劳动力。例如为Alphabet的Wayo和通用汽车的Cruise等公司标注自动驾驶汽车传感器数据,类似于行人、红绿灯和交通标志的图像,或者为Instagram标注购物图片。但最近,随着Scale AI在新一轮融资中获得大量资金,公司已将重点转向在美国招募具有专业知识的高技能承包商来帮助训练模型。也就是说,随着对高质量数据的要求,需要更加专业的人员来训练人工智能该做什么和怎么做。LLM的预训练过程需要大量的资金投入和长时间的等待,但这还不足以确保Anthropic公司的Claude、OpenAI公司的ChatGPT、Meta公司的Llama能提供符合人类常识的准确答案。要做到这一点,还需要第二步:微调,这涉及到大量的人工承包商。他们有的是公司内部雇佣的,有的是从Scale、Surge AI和 Labelbox等其他初创公司雇佣的。对于提交给聊天机器人的问题,这些承包商会撰写合理回答作为ground truth来训练人工智能模型。成立于2016年的Scale公司率先开展了这方面的一些工作。它在2019年与OpenAI合作,研究一种通过人类反馈进行强化学习的方法(即RLHF),成为使聊天机器人产生类似人类响应的重要途径之一。根据The Information获得的一份Scale AI在2月份与投资者共享的演示文稿,他们将正在运行的系统称为「人类与人工智能混合系统,以低成本生成高质量数据」。招聘新思路 马斯克点赞
Alexandr Wang深知,一个生成高质量数据的模型的背后,站着一整个人类智囊团,人才对AI发展的重要性是不可估量的。但他最近在推特上发布的招聘准则,却引发了轩然大波。6月14日,Wang在社交媒体上分享说,他的公司已经正式制定了MEI招聘政策。即「优绩、卓越和才智」,与其他公司流行的DEI,即多元化、公平和包容的政策相比显得独树一帜。在Scale取得成功融资之后,Wang说他收到了一些关于Scale AI人才的问题。他分享说,他亲自面试公司的每一位员工,或在每一份候选人资料包上签字,因为「人才是我们的第一指标」。每当我们邀请某人加入我们时,这都是一件大事,这些决定从未被正统观念、道德标榜或任何普世的价值观所左右。
我认为我们的指导原则是MEI:优绩、卓越和才智。这意味着我们只雇用最适合这份工作的人,我们追求卓越,我们毫不掩饰地偏爱非常聪明的人。
Scale AI将应聘者视为个体,而不是群体的代表。我们不会不公平地将任何人刻板化、标志化,或以其他方式将其视为某个群体的成员而非个体。
在这种观念的指导下,结合当前对Scale服务需求量暴增的情况,Scale招聘高学历、高智商、高能力人才训练大语言模型成为大势所趋。
2022年,Scale的收入增长跌破50%,大大落后于它之前在2019年与投资者分享的收入预期。在当时,每1美元的收入要花费超过1.4美元的运营成本,简直入不敷出。ChatGPT的推出引发了对LLM的投资热潮,也带火了Scale AI。该公司预计今年的营收将从去年的3.34亿美元增长两倍多,略高于10亿美元,而且现金消耗极少。用人成本高启 毛利率下滑
Scale不得不转向美国受过高等教育的劳动力,包括博士、医生和律师,这大大提高了其劳动力成本。在2022年至2023年期间,该公司的毛利率从59%下降到了49%。根据2019年一份给投资者的演示文稿,在非洲、印度和菲律宾工作的员工平均时薪为1.5美元,而Scale支付给受过良好教育的美国员工的时薪却高达40美元。
这让Scale难以为继,Scale告诉投资者,它正在努力降低成本。该公司预测,今年将把毛利率提高5个百分点,到2025年将提高到60%。它正在使用内部工具自动识别「高效专家」来降低人力承包商队伍的成本,并且依靠计算机生成的数据来增强人力工作。Scale还在4月下旬给承包商发送电子邮件,称公司正在削减他们进行任务培训的工作报酬。一名美国工人的新拿到的培训工资时薪只有17美元,其他人的工资也由40美元降至22美元左右。
Scale在一次投资者推介会上表示,它正在建设关键的人工智能基础设施。Scale己开始将自己打造成人工智能的「数据铸造厂」,Wang曾公开谈论过博士、医生和律师在训练人工智能系统方面的优势。他在上个月的播客中谈到,「我们需要最优秀、最聪明的人才贡献数据。他们通过工作能产生非常大的社会影响。换句话来说,为人工智能系统提供数据具有近乎无限的影响力。」Wang在视频中提到了前沿数据的重要性,大量的前沿数据对于模型非常重要。涉及复杂的推理链、复杂的讨论、模型的代理链、数据检索、自我修正等等,这些都是Agent的重要组成部分。Scale为了在美国业务的扩张,已从其海外业务中撤出。据Rest of World报道,Sacle最近关闭了在肯尼亚、尼日利亚和巴基斯坦的承包商分支机构。
亚马逊前高管Jeff Wike于2021年投资了Scale公司,并为Wang提供咨询。
他在接受采访时说,「并不太了解Scale过去所从事项目的具体类型。但现在的工作是为非常复杂的技术挑战给出精密的答案。」
他补充说,技术性更强的工作对「工作人员来说有许多好处」。「物以稀为贵,如果能够胜任的人不多,工资就会很高。」
Melissa Quashie是马萨诸塞州一名自由撰稿人和编辑,几个月前通过LinkedIn入职Scale,成为了一名合同工。Quashie说,在Scale的工作感觉就像是「我玩过的最无聊的电子游戏」,她的任务包括对LLM生成的不同回答进行评分,评分依据是,模型是否有效回答了人们的问题以及回答的文字水平。有一次,她花了两个小时为一个聊天机器人编写了一份膳食计划,来帮助改进聊天机器人的自动回复。为了满足Meta和Alphabet等客户的需求,Scale储备了庞大的员工队伍,到了供过于求的程度。接受The Information采访的10名员工都表示,尽管这份工作的薪酬和灵活性都很诱人,但同样意味着它很不稳定,而且压力很大——训练任务很快被分配一空,人们无事可做,「曾经定期流入的项目开始枯竭」。工人们还抱怨Scale延迟支付工资、没有兑现承诺的奖金、培训不到位以及系统经常崩溃等问题。Scale发言人Amy Swanson在一封电子邮件中回应道,「该项目是灵活的工作,而不是全职工作」。Scale还试图让这些打「零工」的临时雇员建立一些友谊,方法是组织员工飞往AI公司的写作工作坊,进行长达数天的「驻场」工作。一位曾飞往德州奥斯汀的员工说,当时有50位和他一样的雇员在为Alphabet的Bard聊天机器人项目工作,他们查看了每个人针对不同提示所写的回复,晚上还一起唱了卡拉OK。Quashie在「团建」中,遇到了大学教授、博士生、编剧和播客主理人,他们在一起相谈甚欢,每个人都对让LLM变得更好而兴奋,但无人提及一个问题——https://www.theinformation.com/articles/why-a-14-billion-startup-is-now-hiring-phds-to-train-ai-from-their-living-rooms?rc=epv9gihttps://x.com/alexandr_wang/status/1801331034916851995