一个阳光明媚的周三早上,我走进了一个没有窗户的白色房间。房间里,摆着一张干净的白色桌子,桌边,坐着一位约莫四十出头的中年女性。
她的背挺的很直,金色的头发用淡蓝色的发圈束在脑后。见我来了,她将目光从桌上的惠普笔记本上移开,微微一笑,略有些疲惫地向我介绍:“姑娘们都叫我果酱”。在高工资的芬兰,这样的数据标注员并不多见,直到一家公司想到了一个“绝妙的”点子——囚犯。在每个三小时的数据标注轮班里,犯人们能得到1.54欧元(约1.67美元)的报酬。这时,果酱女士的电脑屏幕上跳出了一篇关于房地产的短文,让她来做“阅读理解”。其中的一个问题是:“第一段说的是房地产政策,还是购房建议?”果酱耸了耸肩,她觉得有点无聊——她也不太知道这项任务的意义。“也许我正在训练一个ChatGPT呢?”,她略带自嘲地喃喃自语。事实上,她正在培训Metroc拥有的一款大型语言模型,这家芬兰初创公司试图创建一个AI搜索引擎,帮助建筑公司找到新获批的建筑项目。为了做到这一点,Metroc需要招募精通芬兰语的数据标注工人,帮助其模型理解相关新闻文章和市政文件。上一代的“数据标注师”,主要工作以“打点”和“画框”为主,教机器学习什么是“人脸”,什么是“障碍物”。而新一代的数据标注师,主要工作则更像是做阅读理解,需要帮大模型找错、修改、打分,教会大模型应该生成什么样的内容。在全球范围内,数百万的“数据标注师”正训练着各种AI模型。通常,这些工作者分布在工资水平较低的非洲、印度等地区。不过,对于不想在生成式AI竞争浪潮中掉队的芬兰等欧洲小国而言,这里的员工并不合适——他们看不懂芬兰语。这就是为什么Metroc会打起监狱的点子——这里有便宜的、讲芬兰语的劳动力,花少量人力成本训练出个AI,就能搞到一笔不菲的融资。与此同时,监狱系统也很乐意为囚犯提供这些“不一样”的就业机会,双方一拍即合。
监狱里的「数据标注师」
被收押以来,果酱女士一直被关在Hämeenlinna监狱。
这座建筑物现代化,有着大大的窗户、色彩斑斓的艺术品。如果不是每个入口和出口都被沉重的灰色安全门挡住,这些房间很容易被误认为是一所还不错的大学。芬兰可能以其开放式监狱而闻名——在这些监狱里,囚犯可以在附近的城镇工作或学习——但这座监狱不是。相反,Hämeenlinna是该国安全级别最高的监狱之一,且只收容女性囚犯。果酱女士被判处了六年徒刑——在一个囚犯服刑12年后可以申请释放的国家,六年徒刑堪称是一个重判。
当果酱第一次来到监狱时,她常常看着其他女囚每天早上起床去工作:她们可以自愿做清洁、洗衣服,或者缝制衣物等工作。每六小时的工作,她们可以获得大约6欧元(6.50美元)的报酬。因此,她选择了长时间闷在自己的牢房里。当一位监狱顾问建议她尝试“AI工作”时,只用三小时的“短暂”工作时间吸引了她,而且,相比于什么也不干,多少赚点也算是好的。“尽管不多,但总比呆在牢房里强”,她说。尽管目前她只完成了三个轮班,但她表示,自己已经感到了一种成就感。Hämeenlinna是芬兰三所提供“数据标注师”的监狱之一。这三所监狱中,每个监狱都有三台笔记本电脑,以供囚犯参与这项AI工作。工作没有明确目标,工资按小时结算,而不是根据工作速度或者工作质量发放。监狱的“工作导师”米娜·英基宁坐在果酱女士旁边,她留着剪短的红发,表示,在Hämeenlinna监狱,大约有20名囚犯尝试过这项工作。“有些人肯定比其他人更喜欢这项工作”,她说。不过,当我到达监狱时,却发现,缝纫室已经很忙碌了,但AI工作的小房间却只有果酱一个人。对此,英基宁解释称,目前只有三名囚犯定期自愿参加AI轮班,其他两人目前正在接受法庭审判。“我更喜欢和一组人一起做”,果酱说。她补充道,她喜欢保持房门敞开,这样可以在回答问题的同时与隔壁缝纫机室的人一块聊聊天。这些问题是在监狱南部100公里外的赫尔辛基编写的。在那里,我见到了Metroc公司的创始人兼首席执行官尤西·维尔纳拉。在他们现代、时尚、漂亮的办公室里,他笑着对我说,他们刚刚度过了一个激动人心的一周,公司刚刚宣布了200万欧元(210万美元)的最新一轮融资,他计划用这笔钱向北欧扩展业务。他表示,在与投资者的谈话中,他感受到了投资者对于“芬兰监狱”的热情:
每个人,都对这种创新方式感到兴奋。
我认为,从产品角度来看,这也是非常有价值的。
将监狱作为劳工来源,是维尔纳拉的主意。如前所述,这家芬兰的初创公司需要母语为芬兰语的标注员,以帮助提高其大型语言模型对建筑特定语言的理解。在像芬兰这样高工资的经济体中,寻找这些数据劳工非常困难。由于芬兰有着“非常慷慨”的失业救济福利制度,几乎没有芬兰人愿意干一些低工资的外包活(例如亚马逊的Mechanical Turk)。“Mechanical Turk几乎没有多少芬兰语的工人,”维尔纳拉说。他补充道,自动翻译工具对芬兰语仍然无能为力,这是一种母语人口仅有500万人的“小语种”。
为囚犯提供「多样化」工作选择当维尔纳拉向芬兰监狱和缓刑机构的智能监狱项目负责人皮亚·普拉卡提出他的建议时,后者立刻表现出浓厚兴趣。
普拉卡表示,在新冠疫情之前,另一家名为Vainu的芬兰科技公司曾利用囚犯进行数据劳工。但由于联合创始人之间的分歧、该项目负责人离开公司,这个项目不了了之。所以,当维尔纳拉在2022年提出自己的建议时,普拉卡也非常渴望重新启动AI工作。普拉卡认为,监狱提供此类AI工作,目标并不在于取代传统的监狱工作,如制作道路标志或园艺工作。而是为囚犯提供更多选择。数据标注一天只能干三小时。“如果每天做8小时只有这种工作,可能会很累”,她说,并补充称,如果囚犯可以在进行数据标注的同时参与其他类型的监狱劳工,那将是很好的:
这种工作是未来,如果我们想要帮助囚犯适应监狱外的生活,这些技能可能至少与监狱提供的传统工种一样重要。不过,没人清楚,数据标注工作究竟能为囚犯出狱之后的生活提供多少价值。曾管理Vainu监狱一年的图奥马斯·拉西拉承认,他没有证据表明这一点。他说,该项目没有运行足够长的时间来收集这些证据。还有专家认为,这种新形式的监狱劳动是对廉价劳动力剥削的一部分,而廉价劳动力正是人工智能革命的基础。
研究人工智能的高级研究员阿莫斯·托表示,需求量越来越大的数据标注员,会促使公司越来越多地转向那些几乎没有其他选择的群体,比如“难民、陷入经济危机的国家的人口,以及现在的囚犯。”托对数据劳工是否能帮助囚犯建立数字技能,也持怀疑态度。他表示:
监狱里的人有很多方式来提高自己,比如获得证书和参加教育。
对于以每小时一欧元的价格为公司进行数据标注是否会带来有意义的进展,我持怀疑态度。
回答Hämeenlinna监狱,这所监狱确实为囚犯提供了人工智能在线课程,但果酱只是坐在那里,面无表情地看着电脑……
小国AI的「无奈之举」
将监狱与Metroc办公室对比,女囚们每小时只能获得1.54欧元的报酬,而公司正在庆祝获得2000万欧元的融资——多少有点不太协调,我对监狱项目的价值感到有些矛盾。在赫尔辛基大教堂对面的一家咖啡馆里,我耐心地向赫尔辛基大学的研究员莱赫蒂尼米描述了我的感受。对此,他表示,他认为这些劳动力不是主流社会中的普通劳工。这些人在监狱里,“比较我作为研究员获得的钱和囚犯为他们的监狱劳工获得的钱,这没有意义”。他补充称:
我听到的唯一负面,就是目前的岗位还不够多。只有很少的人可以做它。
进一步,莱赫蒂尼米分析称,“当我们思考数据劳工时,我们倾向于想到Mechanical Turk,想到全球南部或美国农村的人,”但这种做法提供了一种独特的本地数据劳工,不仅有益社会,也为囚犯提供了“脑力工作”机会。同时,这也增强了芬兰语在人工智能革命中的地位。莱赫蒂尼米担心,如果没有这种做法,非英语语言可能会被排除在下一代技术之外:
智能音响仍然难以理解芬兰方言,不是所有芬兰人都很流利地讲英语,所以这些本地形式的数据标注也是必需的。
值得一提的是,Metroc也并不是不得已寻找芬兰数据劳工的唯一公司。2011年,芬兰国家图书馆创建了一个游戏,以激励志愿者帮助数字化其档案。在2020年,芬兰广播公司YLE与赫尔辛基大学和国家发展公司VAKE合作,寻求志愿者捐赠他们讲芬兰语的录音。
「芬兰模式」or 「不良先例」
有些人担心,这种做法可能树立了一个“不良先例”,可能会将更多有争议的数据标注类型引入监狱,比如审查暴力内容。
即使目前在芬兰标注的数据是毫无争议的,我们也必须考虑它所树立的先例。
如果公司看到这是一个未被开发的劳动力池,会有什么能阻止他们将创伤和令人不快的内容的数据标注外包给监狱里的人?
目前,尚不清楚这种“芬兰模式”能否在其他国家复制。根据公民权利组织美国公民自由联盟(ACLU)的数据,76%的囚犯报告称监狱劳工是强制性的。拉西拉说:
美国的监狱系统与芬兰或北欧国家的监狱系统完全不同。这是一个完全不同的理念。
在芬兰,人们对这个项目都持完全积极的态度,因为每个人都知道这是自愿的。
人工智能公司将需要更多的数据劳工,这将迫使它们不断寻找越来越“非常”的劳动力来保持竞争。随着Metroc计划扩展到北欧其他地区和芬兰之外的语言,维尔纳拉正在考虑将监狱劳工项目扩展到其他国家。https://www.wired.com/story/prisoners-training-ai-finland/?redirectURL=https%3A%2F%2Fwww.wired.com%2Fstory%2Fprisoners-training-ai-finland%2F本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。
觉得好看,请点“在看”