Redian新闻
>
帮扶与人工智能标注师: 有多少人工,就有多少智能|自由谈

帮扶与人工智能标注师: 有多少人工,就有多少智能|自由谈

社会

▲  (人民视觉 / 图)


全文共1830字,阅读大约需要4分钟
  • 大多数标注工作是简单的,比如,让AI懂得什么是气球,标注员就需要在一张张含有气球的图片中,圈出气球的位置及气球和背景的分割。这类AI的能力,高度依赖于这些标注,标注的数据越多,AI就越“聪明”。有多少人工,就有多少智能。


本文首发于南方周末 未经授权 不得转载

文|刘远举
责任编辑|陈斌

ChatGPT又一次使得人工智能(AI)成为热门话题。

当下的人工智能主要基于神经网络,即利用算法模拟人类的大脑神经元网络,从而模拟人脑的机制来学习、判断、决策。神经网络需要不断通过对数据的学习实现智能。这种学习,依赖大量的样本标注。在人工智能的学习过程中,需要不断有人“教导”AI,对数据贴标签、做记号、标颜色等,教会AI“感知”“思考”和“决策”。
这些标注中,一部分需要专业性知识,比如在医疗AI中,标注员需要把片子中的肿瘤区域标出来,这就需要医生完成。再比如地方方言或外国文字的内容,则需要标注员掌握那门语言。但大多数标注工作是简单的,比如,让AI懂得什么是气球,标注员就需要在一张张含有气球的图片中,圈出气球的位置及气球和背景的分割线;让AI识别汽车,就需要把图中的车都标出来,画框要精确地刚好卡住车。这类AI的能力,高度依赖于这些标注,标注的数据越多,AI就越“聪明”,所以,业内俗称:有多少人工,就有多少智能。
OpenAI、谷歌、Meta和微软的人工智能成果背后,就有无数肯尼亚、乌干达和印度的工人在工作。在中国,仅北京就有一百多家专门从事数据标注的公司,全国从事这项工作的人超千万。2020年人社部发布的16个新职业之一,就包括数据标注师。
高大上的人工智能背后,有无数人在做着简单而重复的工作,以支撑AI运行。这是一种很正常的技术发展与市场形式。现在自然语言处理方面的应用大多是人工+算法的形式,由于技术还尚有欠缺,为了保证用户体验,多用人力辅助,是合理的。
这些工作有自己独特的特征:简单、繁琐、重复。如果专家、程序员这些相对稀缺的人才都投入到这类工作中,就像厨艺高超的厨师不能专注烹制美食,却花大量时间洗碗、择菜。
这种工作不需要专业能力,只需要人的基本智能——能通过背影识别人;只看到沙发上的尾巴与半个身体就知道是猫;即便被车挡住,也知道是红绿灯。这对机器来说很难,但对人来说却是轻而易举。
而这两个特征,使得数据标注师成为一个天然的扶贫项目。
坐落在黄河边上的山西永和县,曾经是国家级贫困县。但这个小县城却有160名某某公司人工智能项目的人工智能训练师。这当中女性员工135人,当了妈妈的占比高达80%。她们上有老下有小,大部分人学历不高,起步阶段员工全部为高中及以下学历。但因为这份特殊的职业,这些大山里的女性,成为了人工智能大潮的一分子。
这160个人,只是整个标注师产业帮扶功能的一部分。“AI+帮扶”的公益模式,通过AI产业释放出大量就业机会,让低收入群众特别是女性实现在家门口就业脱贫,获得经济收入,提升自身地位。在这个基础上,帮助欠发达县域突破资源条件限制,一定程度实现数字化发展。目前,在吕梁山区,已初步形成数字就业产业带。在贵州万山区,首个试点已培训出31名“AI培育师”,其中77%为贫困女性,90%的人原本没有收入来源。
某种程度上,这是这些欠发达地区的妈妈们所能做的最具有互联网红利、乃至AI时代红利的工作。其实任何新技术行业,都有红利。比如对一个西部山区、初中文化的25岁的男青年来说,最接近互联网红利的工作,就是当一个骑手。他获得的红利当然比不上程序员、产品经理,但比起以往的工作却要高出一截。而标注员的待遇与任务量及难度直接相关,熟练工一天能标几千张图片,月收入最高过万。山西永和县大部分年轻劳动力,月收入不超过2000元,但从事标注工作,人均月收入能达到4000元以上。而且标注员可以不离开家乡,既能照顾家人孩子,同时又能享受到人工智能时代的红利。
贵州万山、山西永和等地,仅仅是一个起点,未来会有更多的人工智能项目,把自己的基础放在欠发达地区,让更多的人获得AI红利,帮助落后地区发展。而从另一个意义上说,他们也是新形式的产业工人。更实用的人工智能,甚至需要几代人的积累而成。这就像如今中国成为世界第一大经济体,是历代无数产业工人辛苦工作的结果。多年以后,人们享受更聪明的人工智能的服务时,系统里也有他们的贡献。
(作者系上海金融与法律研究院研究员)
(本文仅为作者个人观点,不代表本报立场)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
GPT-4被投诉要求禁用:FTC发布的人工智能标准,OpenAI一个都不满足OpenAI 千亿市值背后:外包数据标注员月薪不到两千,每天标注 20 万个单词美国氯乙烯泄漏是切尔诺贝利2.0吗?|自由谈我为ChatGPT做数据标注后受到了“精神创伤”:月薪不到两千,每天标注20万个单词春风行动暨就业援助月火热开展中,长三角丰富的就业岗位、多元帮扶的政策等着你!人工智能会带来人的普遍自由还是普遍弃民?首个由人工智能生成的游戏和电影问世,探秘生成式 AI 如何发展(附相关人工智能产品集)日本啊,日本(十三)利休之死【冬至】最漫长而无助的冬夜· 台湾开始抢药了谁才是黄金档?春节档崛起于贺岁档,已领先国庆档几个身位|自由谈新冠后的中风能与人类谈判、游戏水平媲美真人,Meta 是如何构建新人工智能 CICERO 的?数字经济下一热点板块启动,涨幅已超人工智能|智氪VIP(限时免费)世界上最变态的父母十几年如一日,在“脱贫帮扶”上,他们做了很多实事ChatGPT爆火背后,再看合成数据与人工智能的未来 | GGView 荣耀80 GT成为性能标杆背后:当最懂调校的荣耀遇上骁龙8+ChatGPT的这个弱点,说明人与人工智能没有本质的区别《中国奇谭》小猪妖,何以戳中打工人内心?| 自由谈张峥、小白谈GPT与人工智能:可能是好事,也可能不是就连人工智能也建议暂时回避人工智能股票微软CTO对话比尔·盖茨:GPT-4与人工智能的未来小思考 |自由和舒适辉瑞为何不愿大幅降价促销Paxlovid|自由谈2023,家有多包容,就有多兴旺!退役军人事务部等8部门《关于加强就业困难退役军人帮扶工作的意见》新春走基层丨陕西柞水:科技帮扶托起幸福年亲历高龄患者被拒诊:担心医闹是拒行“有诊无类”的理由吗?|自由谈盘点四大技术板块,洞察百项人工智能开源项目——InfoQ研究中心带你探秘中国人工智能开源领域相向而行——文艺作品中的人与人工智能华策会「承诺纽约」无证儿童帮扶 申请爆棚这一年里有哪些好看的电视剧?无需人工标注,自生成指令框架打破ChatGPT等LLM的成本瓶颈智能革命:人工智能、机器学习、生物 学习和智能材料的合力国家部署!对这类企业,有最新帮扶政策→
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。