陕西省榆林市清涧县,工作人员在进行数据标注|中新社记者,张远
见到曹亚丽时,她正心无旁骛地紧盯电脑屏幕,左手的三个手指覆盖在A、W、S、D四键上,右手则放在键盘的上下键。她的双手配合娴熟,背挺得很直,仿佛钢琴家灵活地按动琴键。每隔两秒,曹亚丽手指动一下,那是她面对一张图作出判断的时间。曹亚丽从事的职业——AI训练师(人工智能训练师)——在2020年被国家正式列为新兴职业。每天,她和同事们通过贴标签、画框、排序、找不同等方式,为文字、图像、语音做标注,喂养AI。至于给数据标注后具体用来做什么,曹亚丽还说不出来。曹亚丽所在的陕西榆林爱豆科技有限公司(以下简称“清涧爱豆”),2019年成立,目前有180余名数据标注员。负责人鱼涛介绍,其中,66%都是女性。
类似的场景,还发生在吕梁山区的山西临汾市永和数字就业中心。后者也是做AI数据标注的公司,133名员工中,128位都是女性。
其中,80%的人还有一重身份:宝妈。
这些女性很多是高中、中专学历,没上过大学。留在老家扎根后,她们变成别人口里的妻子、妈妈。
6月见面时,多位员工向我回忆起一个场景——以前做全职妈妈,总会碰到向丈夫“伸手要钱”的时候,这样的生活倒也并不耻辱,但让人感到毫无价值。
如今,建立在黄土高原上的数字新产业,给了留守女人尊严与希望。在与人工智能的互动中,科技赋予了她们可以消弭先天差距的魔法,也焕发了黄土高原上人们全新的生机。
鼠标一点,都是钱
在兄妹三人中,曹亚丽自认为“属我混得最差”。她是家里老二,哥哥在内蒙古的国企工作,妹妹是教师。只有她,没上过大学,多年在影楼做后期制作。2019年,因家庭变故,她从西安回到清涧县的父母家。曹亚丽在清涧县出生长大。这座2020年才脱贫的县城,是作家路遥的故里。黄土垒成的沟壑环绕四周,只有河流冲击的悠长河谷给了人们居住的空间。在人们的回忆里,县城内一大片的荒地,“没有楼,都是山”。清涧县是“中国红枣之乡”,以种植大个头的狗头枣闻名全国。但近年来,随着气候变化,黄土高原一到秋季就下雨。成熟红枣最怕雨淋,农民常颗粒无收,被荒弃的农田就越来越多。年轻人因此背井离乡,到榆林、西安等地谋生,寻找希望。回乡后,她找不到工作,为此焦虑了一年。2020年,她成为了坐办公室的AI数据标注员。这是小县城里少有的新增就业岗位。只需参加一个月培训,曹亚丽就正式上岗。两年多来,她都在做类似的事:给某地图导航做标注。她向我演示了一张行车记录仪的图,屏幕上下有两个时间戳。数据标注员则需要人为将两个时间相减,判断差值。“小于2秒就是合格的,按A;大于2秒不合格,选S;看不清,选D,无时间戳W。”2023年2月16日,陕西省榆林市清涧县,工作人员在进行数据标注。数据标注为人工智能产业中开发机器学习模型的一环。清涧县数字就业中心成立三年多来,通过培训当地女性、返乡年轻人等做数据标注师,助力乡村女性在本地就业|中新社记者,张远曹亚丽说,难度不在于做减法,而是面对海量的图片,标注员必须保持专注和准确率。曹亚丽刚入职时,每天须看1.3万张图,她没法在8小时工作时间内完成。而现在,她已经足够熟练,6个多小时就能做完相同的工作量;努力加班的话,“一天能看3万张”。上述任务与人工智能界流行的“深度学习”有关。2014年起,深度学习的一大主流发展路径是有监督学习(supervised learning)。也就是说,要想让机器智能,首先要喂养大量已经标注的数据,让其自动学习、决策,完成特定任务。而在AI进行算法迭代时,同样需要处理、标注大量数据。据AI分析公司Cognilytica统计,在AI项目中,数据相关的处理过程占超80%的时间。业内因此盛传,“人工有多强大,智能才有多强大”。人工智能的业务,从高大上的甲级写字楼落到了黄土高原上。与县城女人们多聊会儿天,便会感受到她们对这一新业务的渴望。曹亚丽说,因为按件计工资,她会每天早上5时半起床,不看手机,直奔公司。中午也不午休,吃完饭便上班到晚上10时、11时。热爱工作的不止曹亚丽。甚至爱豆科技有限公司的多位女性员工都说,她们想加班。一位两个孩子的妈妈坐在我面前,穿着一件飘逸的粉色长裙,看着我的眼睛,坚定地说:“我就是想多挣钱。”工作两年后,她成为了某业务线的项目经理,每天加班到夜里孩子的睡觉时间。月薪最高时,她拿了7000多元。
宝妈的玫瑰花
人工智能的风,从清涧县吹到了周围的县市。2020年8月,与清涧临近的山西临汾永和县,新设立了一个数字就业中心,招的也是人工智能训练师。对这个长期交通闭塞、只有两条主干道、多数楼房不超过4层的县城而言,人工智能属于格格不入的新事物。永和县爱豆科技有限公司总经理李林峰,对我说起他至今难以忘怀的场景。2012年,他从永和县到临汾市上大学,通往县城的第一条高速公路刚开通。他兴奋地与同学分享,家乡有公路了。同学表现得十分诧异:“高速路,这不是(我们)从出生开始就有的东西吗?”“别人想象不到,有的地方连高速路都没有。”李林峰说。与此同时,临汾市主要的产煤区、铁矿资源区、小麦产区,都与永和县擦肩而过。直到2015年,永和县内探测出天然气,几个气站成为了吸纳当地男性劳动力的用工企业。经济落后让人止不住地外流。除了老人,县城里出现的身影多是妇女儿童。所以李林峰介绍:“我们永和有个最常见的家庭分工:男的出去开大货车,一个月赚七八千;女人留守,照顾孩子。”这解释了为什么2020年7月永和县爱豆科技有限公司第一次招聘时,来报名的基本是女性。刘霞,永和县人,在2021年成为人工智能训练师时,她的二娃刚满1岁。而之前的七年,因为孩子出生,刘霞经历了辞职、工作、又辞职。她的上一份工作在加油站,需要两班倒。上了一年多夜班,刘霞发现,不仅没法照顾孩子,熬夜还让她眼角多了皱纹。爱美的她,很敏感地感受到自己的变化,索性辞了职。“自己都瞧不起自己”,但她又认为,这样的生活像是县城女人注定的命运。刘换梅,34岁,陕西清涧,她是一名人工智能训练师。这个听起来很时髦的工作,是清涧县和支付宝合作引到当地的|视觉中国在永和县结婚生子之前,刘霞曾在临汾市服装店卖了六年衣服。做销售小妹时,她刚高中毕业,学习成绩在班上排名前列。但兄妹四人,没人上过大学,“那时觉得读大学还不如学一门技术,出来早点挣钱”。父母也不管她,于是她独自踏上异乡打拼的路。如今,在服装店上班的记忆,只剩下“站一天,腿很麻”。但刘霞个性倔强。即使感到累,想着“别人都可以为什么我不行”,她在服装店干了下去。直到她到了25岁,县城认为女人该结婚的年纪,在亲人的催促下,刘霞觉得自己没在临汾“混出什么名堂来”,回了老家,进入婚姻。结婚一年后,与家乡其他女人一样,因为怀孕,她辞职了,三年没工作。但她心里很清楚:“我喜欢出去。”从小,她和妈妈一样,宁愿到农村的地里干农活,也不愿意做家务。她告诉我,永和县里,像她这样想的全职主妇很多,大家都希望有一份自己的事业。但县城长期只有服务业招人。一周7天上班,兼顾带娃不现实。2020年,开在县城的AI企业,在招聘广告上明晃晃写着“周末双休”,这让坐月子的刘霞酝酿着出门工作。更让她按捺不住的是,同龄朋友中,几位宝妈在朋友圈晒出在AI企业工作的状态——“三八妇女节,她们每个人都有一支玫瑰花。”这让刘霞很羡慕。结婚七年,她没有收到过丈夫的礼物。就这样,一传十十传百,对女性友好的人工智能工作在县城传开,吸引了大量“宝妈”报名。李林峰也惊讶地发现,明明没有刻意强调性别,但永和县爱豆公司里超过95%都是女性。“人家给我们什么我们做什么,我们不挑。”一位永和宝妈说。她们更在意的是,做标注员拿人均三四千薪资,超过了县城事业编的水平。一家最大用工企业
AI标注产业让黄土高原的人们如沐春风。但在外面的世界,是一个竞争激烈的市场。据前瞻产业研究院统计,中国数据标注公司从2014年兴起,到2017年达到发展高峰。那一年,相关融资事件达到9起。这个数字,也是接下来多年的高峰。2018年起,与AI数据有关的公司融资量开始下滑。到了2021年,相关融资只剩下一年2笔。一位业内人士透露,AI数据标注产业一大特点是劳动密集,因此,国内存在大量标注的小作坊、工作室。他们以低薪招人,互打“价格战”。很长一段时间,数据标注行业处在卷价格的粗放状态。相较之下,曹亚丽、刘霞等对数据标注的竞争感知不深。被问及会否担心公司倒闭失业,她们直摇头。此前,清涧县尝试过多次产业扶贫,养猪、果业、畜牧业。清涧县爱豆科技有限公司总经理鱼涛回忆说:“人们能想到的农村能干的,我们县都干过,几乎都失败”。这一说法得到一位接近政府人士的侧面认证。他回忆,清涧县曾多次引进果业公司,做红枣加工,但无一例外,来到清涧落地的企业,都以破产倒闭告终。2019年,最早提出在小县城发展人工智能的,是国家卫健委在清涧县挂职的副县长柳清海。而实际上,2019年时,清涧县除了柳清海,没人理解何为人工智能。鱼涛回忆,那一年,他还在清涧县城投公司担任副总,收到来自县里的电话,对方让他到新成立的公司当负责人。与柳清海接触后,鱼涛理解了发展人工智能的思路。“这至少是一个轻资产的项目。”万一发展不好,也不会像此前破产的企业那么惨烈,“船小好掉头嘛”。2019年,在国家卫健委的协调引进下,由中国妇女发展基金会、蚂蚁集团、蚂蚁公益基金会等发起的数字产业孵化项目“AI豆计划”,落地清涧。爱豆的第一次招聘在2019年夏天,招聘宣传得轰轰烈烈,当地妇联、团委、人社局等都帮忙发了招聘启事,连电视台都打了广告,但还是没招揽到人。这个职业对县城人民来说,实在过于陌生。“再加上以前也有一些倒闭的产业,大家也不太愿意相信。”鱼涛说。直到2020年,受疫情影响,县城人多数居家。此时,鱼涛与几名管理层将一台台电脑送至员工的家,让他们居家办公。
有一个月,一名员工拿到了1万多元的薪水,远超当地服务业2000元左右的工资。这在小县城迅速地成为爆炸性消息。清涧爱豆公司的名气此后打响,来应聘的人源源不绝,很快成为当地最大用工企业。清涧成为样板。柳清海近日在接受媒体采访时总结,清涧县的经验说明,数字经济、人工智能有转移到西部地区的空间。接下来的三年,周边县城永和、子洲、绥德、延川县的“AI豆计划”数字就业中心陆续启用,皆以清涧爱豆为母公司。据统计,这些中心共计吸纳了超600名当地女性和返乡就业青年加入。清涧县爱豆员工李阿倩向我提起,在一次接受采访时,记者问她:“你知道ChatGPT吗?”李阿倩第一次听说这个词,“那时候我才感到自己的落后,这边和外面还是有很大差距”。云测数据总经理贾宇航也曾告诉南风窗,随着ChatGPT和大模型的发展,如今,数据标注的类型和内容越来越复杂。“最早的人脸识别,只需要在人脸上做一个拉框的标注,就可以完成对应需要的训练。”贾宇航举例:“而现在,还要求对人脸的关键点、表情或者一些人脸的属性或者姿态,例如半张脸被遮挡时等情况,进行标注。”早期的人脸识别与现在的人脸识别需要训练的内容有区别|视觉中国鱼涛也发现,ChatGPT等引发的大模型狂潮,对数据标注产业冲击很大,标注难度也在阶梯式上升。“我们这一批初中学历的人,有的被AI取代了。我们已经没任务给他们安排。”鱼涛说:“200个人的标注公司已经是我们县的天花板了。”目前,需要的是高学历或者有专业背景的人,比如金融、医疗专业的年轻人。而这类人才,大部分都外出工作,或者回县城考编。在他看来,扎根在黄土高原的数据标注企业,是一种更为特殊、少数的实践。此前,永和县政府曾尝试过扶持电商直播等产业,但都没能收到类似的效果。原因是,“电商没能提供那么多就业岗位”。他认为,数据标注产业在黄土高原发展的优势,恰恰在于它是劳动密集型产业,有助于吸纳女性的就业。据介绍,爱豆公司将90%以上的营收,用于员工薪酬福利。59%的员工,是曾经的脱贫、低保、残障等防返贫重点监测人口。有产业和就业岗位,刺激人才回流、发挥女性力量才成为可能。以永和为例,2020年AI公司启动时,员工中仅有一名大学生。而成立两年多来,员工专科及以上学历大学生占比已超30%。如今,宝妈们的身影不止出现在家、菜市场、校门口以及麻将馆。在公司、美甲美容店和健身房里,她们化着妆,背挺得很直。如果一个县城招200人是天花板,那么他希望“多点开花”——今后周边的每个县都设立一个数字就业中心。“如此一来,我们实力会更强。谁有大量的数据(需标注),我们一口就给吞下。”
地球探索者:
朱秋雨,南风窗高级记者