Redian新闻
>
帮扶与人工智能标注师: 有多少人工,就有多少智能|自由谈

帮扶与人工智能标注师: 有多少人工,就有多少智能|自由谈

社会

▲  (人民视觉 / 图)


全文共1830字,阅读大约需要4分钟
  • 大多数标注工作是简单的,比如,让AI懂得什么是气球,标注员就需要在一张张含有气球的图片中,圈出气球的位置及气球和背景的分割。这类AI的能力,高度依赖于这些标注,标注的数据越多,AI就越“聪明”。有多少人工,就有多少智能。


本文首发于南方周末 未经授权 不得转载

文|刘远举
责任编辑|陈斌

ChatGPT又一次使得人工智能(AI)成为热门话题。

当下的人工智能主要基于神经网络,即利用算法模拟人类的大脑神经元网络,从而模拟人脑的机制来学习、判断、决策。神经网络需要不断通过对数据的学习实现智能。这种学习,依赖大量的样本标注。在人工智能的学习过程中,需要不断有人“教导”AI,对数据贴标签、做记号、标颜色等,教会AI“感知”“思考”和“决策”。
这些标注中,一部分需要专业性知识,比如在医疗AI中,标注员需要把片子中的肿瘤区域标出来,这就需要医生完成。再比如地方方言或外国文字的内容,则需要标注员掌握那门语言。但大多数标注工作是简单的,比如,让AI懂得什么是气球,标注员就需要在一张张含有气球的图片中,圈出气球的位置及气球和背景的分割线;让AI识别汽车,就需要把图中的车都标出来,画框要精确地刚好卡住车。这类AI的能力,高度依赖于这些标注,标注的数据越多,AI就越“聪明”,所以,业内俗称:有多少人工,就有多少智能。
OpenAI、谷歌、Meta和微软的人工智能成果背后,就有无数肯尼亚、乌干达和印度的工人在工作。在中国,仅北京就有一百多家专门从事数据标注的公司,全国从事这项工作的人超千万。2020年人社部发布的16个新职业之一,就包括数据标注师。
高大上的人工智能背后,有无数人在做着简单而重复的工作,以支撑AI运行。这是一种很正常的技术发展与市场形式。现在自然语言处理方面的应用大多是人工+算法的形式,由于技术还尚有欠缺,为了保证用户体验,多用人力辅助,是合理的。
这些工作有自己独特的特征:简单、繁琐、重复。如果专家、程序员这些相对稀缺的人才都投入到这类工作中,就像厨艺高超的厨师不能专注烹制美食,却花大量时间洗碗、择菜。
这种工作不需要专业能力,只需要人的基本智能——能通过背影识别人;只看到沙发上的尾巴与半个身体就知道是猫;即便被车挡住,也知道是红绿灯。这对机器来说很难,但对人来说却是轻而易举。
而这两个特征,使得数据标注师成为一个天然的扶贫项目。
坐落在黄河边上的山西永和县,曾经是国家级贫困县。但这个小县城却有160名某某公司人工智能项目的人工智能训练师。这当中女性员工135人,当了妈妈的占比高达80%。她们上有老下有小,大部分人学历不高,起步阶段员工全部为高中及以下学历。但因为这份特殊的职业,这些大山里的女性,成为了人工智能大潮的一分子。
这160个人,只是整个标注师产业帮扶功能的一部分。“AI+帮扶”的公益模式,通过AI产业释放出大量就业机会,让低收入群众特别是女性实现在家门口就业脱贫,获得经济收入,提升自身地位。在这个基础上,帮助欠发达县域突破资源条件限制,一定程度实现数字化发展。目前,在吕梁山区,已初步形成数字就业产业带。在贵州万山区,首个试点已培训出31名“AI培育师”,其中77%为贫困女性,90%的人原本没有收入来源。
某种程度上,这是这些欠发达地区的妈妈们所能做的最具有互联网红利、乃至AI时代红利的工作。其实任何新技术行业,都有红利。比如对一个西部山区、初中文化的25岁的男青年来说,最接近互联网红利的工作,就是当一个骑手。他获得的红利当然比不上程序员、产品经理,但比起以往的工作却要高出一截。而标注员的待遇与任务量及难度直接相关,熟练工一天能标几千张图片,月收入最高过万。山西永和县大部分年轻劳动力,月收入不超过2000元,但从事标注工作,人均月收入能达到4000元以上。而且标注员可以不离开家乡,既能照顾家人孩子,同时又能享受到人工智能时代的红利。
贵州万山、山西永和等地,仅仅是一个起点,未来会有更多的人工智能项目,把自己的基础放在欠发达地区,让更多的人获得AI红利,帮助落后地区发展。而从另一个意义上说,他们也是新形式的产业工人。更实用的人工智能,甚至需要几代人的积累而成。这就像如今中国成为世界第一大经济体,是历代无数产业工人辛苦工作的结果。多年以后,人们享受更聪明的人工智能的服务时,系统里也有他们的贡献。
(作者系上海金融与法律研究院研究员)
(本文仅为作者个人观点,不代表本报立场)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
亲历高龄患者被拒诊:担心医闹是拒行“有诊无类”的理由吗?|自由谈OpenAI 千亿市值背后:外包数据标注员月薪不到两千,每天标注 20 万个单词GPT-4被投诉要求禁用:FTC发布的人工智能标准,OpenAI一个都不满足能与人类谈判、游戏水平媲美真人,Meta 是如何构建新人工智能 CICERO 的?就连人工智能也建议暂时回避人工智能股票张峥、小白谈GPT与人工智能:可能是好事,也可能不是智能革命:人工智能、机器学习、生物 学习和智能材料的合力【冬至】最漫长而无助的冬夜· 台湾开始抢药了小思考 |自由和舒适数字经济下一热点板块启动,涨幅已超人工智能|智氪VIP(限时免费)ChatGPT的这个弱点,说明人与人工智能没有本质的区别盘点四大技术板块,洞察百项人工智能开源项目——InfoQ研究中心带你探秘中国人工智能开源领域世界上最变态的父母如何利用人寿保险达到省税避税的功能| 新移民财税规划 2023系列课《中国民航报》:智慧赋能|多系统协同 赋能保山机场安全运行日本啊,日本(十三)利休之死我为ChatGPT做数据标注后受到了“精神创伤”:月薪不到两千,每天标注20万个单词12/25贝特曼直播间·刘宇主讲|怎样理解EB-5投资期、延期与二投可能|公司专栏微软CTO对话比尔·盖茨:GPT-4与人工智能的未来ChatGPT爆火背后,再看合成数据与人工智能的未来 | GGView 辉瑞为何不愿大幅降价促销Paxlovid|自由谈无需人工标注,自生成指令框架打破ChatGPT等LLM的成本瓶颈谁才是黄金档?春节档崛起于贺岁档,已领先国庆档几个身位|自由谈人工智能会带来人的普遍自由还是普遍弃民?新冠后的中风首个由人工智能生成的游戏和电影问世,探秘生成式 AI 如何发展(附相关人工智能产品集)2023,家有多包容,就有多兴旺!首个海外储能工厂落户上海,马斯克鏖战储能|焦点分析十几年如一日,在“脱贫帮扶”上,他们做了很多实事这一年里有哪些好看的电视剧?「智道合创」完成天使轮融资,聚焦新能源资产管理与数字化赋能|早起看早期美国氯乙烯泄漏是切尔诺贝利2.0吗?|自由谈《中国奇谭》小猪妖,何以戳中打工人内心?| 自由谈相向而行——文艺作品中的人与人工智能荣耀80 GT成为性能标杆背后:当最懂调校的荣耀遇上骁龙8+
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。