Redian新闻
>
OpenAI 千亿市值背后:外包数据标注员月薪不到两千,每天标注 20 万个单词

OpenAI 千亿市值背后:外包数据标注员月薪不到两千,每天标注 20 万个单词

公众号新闻

 作者 | Jaime Hampton
译者 | 核子可乐
策划 | 李冬梅

ChatGPT 被视为近几年最具创新性的 AI 工具之一。这款强大的 AI 聊天机器人几乎可以生成任何问题的文本,从莎士比亚的十四行诗,到用 5 岁孩子能理解的语言描述复杂的数学问题,可谓“无所不能”。

近日,TIME 发布了一篇独家报道,发现 ChatGPT 在构建内容过滤器时所使用的标注数据由肯尼亚工人完成,且每小时收入不足 2 美元。

根据作者 Billy Perrigo 的说法,数据标注员的任务是阅读和标注文本内容,从“互联网上最阴暗的角落”中提取“最血淋淋的细节表达,包括儿童性虐待、兽行、杀人、自杀、酷刑、折磨、自残和乱伦等内容。”

1 外包数据标注工人时薪不到 2 美元

Perrigo 提到,根据资历和绩效,这些工人的最低税后时薪仅为 1.32 美元,最高税后时薪也不过 1.44 美元。英国广播公司 BBC 的一份报告估计,肯尼亚约有 75% 的工人住在非洲最大的贫民窟之一,内罗毕的基贝拉贫民窟。当地的失业率高达 50%,缺乏清洁水,也没有卫生设施可用。

承担这份外包工作的是 Sama(原 Samasource),一家位于旧金山的公司。该公司向来以建设“道德 AI”自居,号称要在数字工作与低收入人群之间搭设纽带。该公司在肯尼亚、乌干达和印度等地雇用人员,为谷歌、Meta 和微软等科技大厂提供数据标注服务。

作为 OpenAI 旗下最当红的聊天机器人,ChatGPT 采用的是升级版本的大语言模型 GPT-3.5。该聊天机器人于去年 11 月下旬首度亮相,推出不到一周就吸引到了超百万用户。ChatGPT 的用例包括数字内容生成、写作和代码调试。与其他同样基于 GPT-3.5 模型的前任服务一样,由于大量使用从互联网处采集到的训练数据,ChatGPT 极易输出有害内容。为了解决这个难题,OpenAI 必须为其开发内容过滤器。

2019 年,Sama 公司在肯尼亚雇佣大量工人,并声称帮助他们摆脱了贫困。

OpenAI 证实,Sama 公司雇用的肯尼亚员工确实在帮助 ChatGPT 过滤各种有害内容。该公司发言人表示,“我们的使命是确保人工通用智能有益于全人类的福祉,也一直在努力打造安全有用的 AI 系统、控制其中的偏见与有害内容。只有对有害(文本和图像)进行分类和过滤,才能最大程度减少训练数据中所包含的暴力和性内容,同时创建出能够检测有害内容的工具。”

2 “做这份工作是一种精神创伤”

TIME 还采访了四围名 Sama 公司员工,他们表示自己的工作体验可以用“精神创伤”来形容。有三名工人表示,他们每天需要阅读 150 到 250 条材料片段,这些段落的范围从 100 个单词到 1000 多个单词不等,算起来,平均每小时他们最多要阅读和标注超过 2 万个单词;但 Sama 对此表示质疑,称员工每天只需要审查 70 条片段即可。

TIME 在报道中提到,Sama 组织的三支数据标注团队中,每个小组都专注于一个主题。大多数成员的月工资为 170 美元,奖金最高不超过 70 美元。如果准确性特别高或者标注速度特别快,还能赚到额外的佣金。

报道称,以一天工作九个小时计算,那么税后时薪最低为 1.32 美元;如果能够达成所有考核要求,则时薪会略微上涨至税后 1.44 美元。Perrigo 还强调,肯尼亚不存在充分就业市场,所以很难对收入做出公平比较。不过在这批员工入职时,内罗毕接待员岗位的最低工资为每小时 1.52 美元。

Perrigo 发布推文称,“这样的工作条件也揭露出 AI 繁荣之下的阴暗面:AI 的发展,依靠的就是这群默默无闻的低薪工人。尽管他们为价值数十亿美元的新兴产业做出贡献,但仍然被严重边缘化。”随着微软与 OpenAI 的合作加深,OpenAI 的市场估值早已超过 300 亿美元(约 2072 亿元人民币)。

媒体 Quartz 也曾报道过此事,Sama 方面主动联系并对薪酬做了澄清,称其在东非地区设定的工资是其他内容审核公司的几乎两倍。“Sama 设定的月薪在 210 美元到 323 美元之间,达到肯尼亚最低工资的两倍以上,也远远超过了最低生活需求。相比之下,美国同类岗位的工资在每小时 30 至 45 美元之间。”

另外,Sama 还表示会为当地员工提供其他个人福利,包括咨询、冥想、祈祷、护理、游戏和本地艺术表演,“以及有益身心健康的全面餐饮服务”。但 TIME 在采访中得知,工人们为了完成每天的绩效考核,往往没时间去接受这些咨询指导。两位受访者表示,Sama 公司的管理层拒绝与他们一对一交流,转而用小组会议的形式代替。

2022 年 2 月,Sama 公司结束了与 OpenAI 间的服务合同,比预定计划提前的 8 个月。根据 TIME 的报道,双方的另一个数据标注项目已经启动,这次是处理包含非法内容的图像。OpenAI 发表了一份声明,称图像集中包含非法内容是因为沟通失误。

今年 1 月 10 日,Sama 公司宣布取消一切涉及敏感内容的剩余工作,包括与 Facebook 签订的价值 390 万美元的内容审核合同。接下来,Sama 将专注于为计算机视觉数据提供标注服务。

原文链接:

https://www.datanami.com/2023/01/20/openai-outsourced-data-labeling-to-kenyan-workers-earning-less-than-2-per-hour-time-report/

声明:本文为 InfoQ 翻译,未经许可,禁止转载

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

平台工程不适合中国企业?这个观点值得反驳!

科大讯飞回应用“绩效回溯”变相降薪;OpenAI逆天开放API,价格打骨折;推特裁员超70%,马斯克给剩下员工“画饼”?|Q资讯

直接到云上做开发?先等等,这个方案还“半生不熟”

“干净”的代码,贼差的性能

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
最低时薪仅9元,每小时或标注2万个单词…ChatGPT背后的“血汗工厂”曝光:有员工遭受持久心理创伤3月1日起,月薪不到这个数,违法!只需说一个单词,在麦当劳就能得到加量甜筒!快来薅羊毛吧Agustín Hernández:中美洲建筑背景下的未来主义巨构ChatGPT要把数据标注行业干掉了?比人便宜20倍,而且还更准睡凶宅、守墓…年轻人猎奇搞钱:想日赚两千,先没了3457元7 Papers & Radios | GPT-4学会反思;ChatGPT数据标注比人便宜20倍[干货]现代人生存状态用两个单词可以道尽。扎心!慎点!Scale AI:大模型还需要数据标注吗?1天烧掉10万美元的ChatGPT正式开放API:成本大砍90%,75万个单词仅收费2美元观剧偶感(十二)「恺望数据」获新一轮战略融资,以「自动化产线+规模化人力」提升数据标注效率|早起看早期65岁知名浙商突发心脏病去世;ChatGPT被曝曾雇佣数据标注“血汗工厂”;华为再次回应:不造车丨邦早报投资人竞相追逐的数据标注公司,能撑起国产ChatGPT野心吗?|数智前瞻ChatGPT背后的标注人:在非洲只管「鉴黄」,时薪不到两美元英语太差,每个单词都需要查,我还要继续考CFA吗?推荐 | 企业数据资产盘点与数据标准梳理方法兔年的“兔”到底用哪个单词?千亿ChatGPT的狂欢和月薪3K的数据标注员新药研发外包快速发展,千亿市场潜力吸引更多入局者清华妈妈月挣两千,我用十年与自己和解七绝二首哄孩子的“哄”,竟是这个单词,超温馨!建了个单词记忆群,限时免费进,还剩200人群满!我为ChatGPT做数据标注后受到了“精神创伤”:月薪不到两千,每天标注20万个单词国内外包原画价大跌,部分国外游戏厂商:禁止外包用AI、必须人画制造业4.0与内部5G网络趋势农业与互联网|玉溪鲜花:31亿产值背后的云上“新农人”Sarasota印象涨工资了!1月1日起工资新规正式实施!月薪不到这个数,单位违法!《人民》就是全世界受苦的人!「恺望数据」获新一轮战略融资,以「自动化产线+规模化人力」提升数据标注效率|36氪首发OpenAI逆天发布ChatGPT API!100万个单词才18元,价格打骨折一次只要0.003美元,比人类便宜20倍!ChatGPT让数据标注者危矣1天烧掉10万美元的ChatGPT努力搞钱:正式开放API,成本大砍90%,75万个单词仅收费2美元
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。