Redian新闻
>
我为ChatGPT做数据标注后受到了“精神创伤”:月薪不到两千,每天标注20万个单词

我为ChatGPT做数据标注后受到了“精神创伤”:月薪不到两千,每天标注20万个单词

公众号新闻

作者 | Jaime Hampton

译者 | 核子可乐

策划 | 冬梅

ChatGPT 被视为近几年最具创新性的 AI 工具之一。这款强大的 AI 聊天机器人几乎可以生成任何问题的文本,从莎士比亚的十四行诗,到用 5 岁孩子能理解的语言描述复杂的数学问题,可谓“无所不能”。

近日,TIME 发布了一篇独家报道,发现 ChatGPT 在构建内容过滤器时所使用的标注数据由肯尼亚工人完成,且每小时收入不足 2 美元。

根据作者 Billy Perrigo 的说法,数据标注员的任务是阅读和标注文本内容,从“互联网上最阴暗的角落”中提取“最血淋淋的细节表达,包括儿童性虐待、兽行、杀人、自杀、酷刑、折磨、自残和乱伦等内容。”

外包数据标注工人时薪不到 2 美元

Perrigo 提到,根据资历和绩效,这些工人的最低税后时薪仅为 1.32 美元,最高税后时薪也不过 1.44 美元。英国广播公司 BBC 的一份报告估计,肯尼亚约有 75% 的工人住在非洲最大的贫民窟之一,内罗毕的基贝拉贫民窟。当地的失业率高达 50%,缺乏清洁水,也没有卫生设施可用。

承担这份外包工作的是 Sama(原 Samasource),一家位于旧金山的公司。该公司向来以建设“道德 AI”自居,号称要在数字工作与低收入人群之间搭设纽带。该公司在肯尼亚、乌干达和印度等地雇用人员,为谷歌、Meta 和微软等科技大厂提供数据标注服务。

作为 OpenAI 旗下最当红的聊天机器人,ChatGPT 采用的是升级版本的大语言模型 GPT-3.5。该聊天机器人于去年 11 月下旬首度亮相,推出不到一周就吸引到了超百万用户。ChatGPT 的用例包括数字内容生成、写作和代码调试。与其他同样基于 GPT-3.5 模型的前任服务一样,由于大量使用从互联网处采集到的训练数据,ChatGPT 极易输出有害内容。为了解决这个难题,OpenAI 必须为其开发内容过滤器。

2019 年,Sama 公司在肯尼亚雇佣大量工人,并声称帮助他们摆脱了贫困。

OpenAI 证实,Sama 公司雇用的肯尼亚员工确实在帮助 ChatGPT 过滤各种有害内容。该公司发言人表示,“我们的使命是确保人工通用智能有益于全人类的福祉,也一直在努力打造安全有用的 AI 系统、控制其中的偏见与有害内容。只有对有害(文本和图像)进行分类和过滤,才能最大程度减少训练数据中所包含的暴力和性内容,同时创建出能够检测有害内容的工具。”

“做这份工作是一种精神创伤”

TIME 还采访了四围名 Sama 公司员工,他们表示自己的工作体验可以用“精神创伤”来形容。有三名工人表示,他们每天需要阅读 150 到 250 条材料片段,这些段落的范围从 100 个单词到 1000 多个单词不等,算起来,平均每小时他们最多要阅读和标注超过 2 万个单词;但 Sama 对此表示质疑,称员工每天只需要审查 70 条片段即可。

TIME 在报道中提到,Sama 组织的三支数据标注团队中,每个小组都专注于一个主题。大多数成员的月工资为 170 美元,奖金最高不超过 70 美元。如果准确性特别高或者标注速度特别快,还能赚到额外的佣金

报道称,以一天工作九个小时计算,那么税后时薪最低为 1.32 美元;如果能够达成所有考核要求,则时薪会略微上涨至税后 1.44 美元。Perrigo 还强调,肯尼亚不存在充分就业市场,所以很难对收入做出公平比较。不过在这批员工入职时,内罗毕接待员岗位的最低工资为每小时 1.52 美元。

Perrigo 发布推文称,“这样的工作条件也揭露出 AI 繁荣之下的阴暗面:AI 的发展,依靠的就是这群默默无闻的低薪工人。尽管他们为价值数十亿美元的新兴产业做出贡献,但仍然被严重边缘化。”随着微软与 OpenAI 的合作加深,OpenAI 的市场估值早已超过 300 亿美元(约 2072 亿元人民币)。

媒体 Quartz 也曾报道过此事,Sama 方面主动联系并对薪酬做了澄清,称其在东非地区设定的工资是其他内容审核公司的几乎两倍。“Sama 设定的月薪在 210 美元到 323 美元之间,达到肯尼亚最低工资的两倍以上,也远远超过了最低生活需求。相比之下,美国同类岗位的工资在每小时 30 至 45 美元之间。”

另外,Sama 还表示会为当地员工提供其他个人福利,包括咨询、冥想、祈祷、护理、游戏和本地艺术表演,“以及有益身心健康的全面餐饮服务”。但 TIME 在采访中得知,工人们为了完成每天的绩效考核,往往没时间去接受这些咨询指导。两位受访者表示,Sama 公司的管理层拒绝与他们一对一交流,转而用小组会议的形式代替。

2022 年 2 月,Sama 公司结束了与 OpenAI 间的服务合同,比预定计划提前的 8 个月。根据 TIME 的报道,双方的另一个数据标注项目已经启动,这次是处理包含非法内容的图像。OpenAI 发表了一份声明,称图像集中包含非法内容是因为沟通失误。

今年 1 月 10 日,Sama 公司宣布取消一切涉及敏感内容的剩余工作,包括与 Facebook 签订的价值 390 万美元的内容审核合同。接下来,Sama 将专注于为计算机视觉数据提供标注服务。


参考链接:

https://www.datanami.com/2023/01/20/openai-outsourced-data-labeling-to-kenyan-workers-earning-less-than-2-per-hour-time-report/

今日荐文

1天烧掉10万美元的ChatGPT努力搞钱:正式开放API,成本大砍90%,75万个单词仅收费2美元

年薪超200万的最新最热技术岗:无需编码,靠给AI吹“枕边风”赚钱


马斯克开会当场解雇Twitter首席工程师:我有1亿多粉丝,他却说公众对我失去兴趣


Meta发布全新大语言模型,号称比ChatGPT更强,单GPU上就能跑,后续或将开源


阿里去年裁员19000人;库克今年将降薪3.5亿;特斯拉前CEO批马斯克:喜欢随机炒员工 | AI一周资讯


复旦抢发第一个中国版 ChatGPT !内测服务器被挤崩,团队致歉:还不成熟

你也「在看」吗? 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
「恺望数据」获新一轮战略融资,以「自动化产线+规模化人力」提升数据标注效率|早起看早期2022 stocks 投坛我为ChatGPT4.0设置了七道数学证明关卡,猜猜它会闯过第几关??Could China ever surpass the United States economically?斯坦福等学者对ChatGPT做了在NLP几乎所有任务上的优劣势分析「恺望数据」获新一轮战略融资,以「自动化产线+规模化人力」提升数据标注效率|36氪首发用ChatGPT做Excel,到底能做到什么水平,答案来了!ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇千亿ChatGPT的狂欢和月薪3K的数据标注员OpenAI逆天发布ChatGPT API!100万个单词才18元,价格打骨折一次只要0.003美元,比人类便宜20倍!ChatGPT让数据标注者危矣65岁知名浙商突发心脏病去世;ChatGPT被曝曾雇佣数据标注“血汗工厂”;华为再次回应:不造车丨邦早报投资人竞相追逐的数据标注公司,能撑起国产ChatGPT野心吗?|数智前瞻文化大革命是新文化运动的继续一位法官刚刚使用ChatGPT做出法庭判决全球都为ChatGPT疯狂,它到底是风口还是虚火?深度解读风暴眼中的ChatGPT | 直播预约OpenAI 千亿市值背后:外包数据标注员月薪不到两千,每天标注 20 万个单词ChatGPT长出狗身子!波士顿动力ChatGPT狗,说话、整理数据超级61天烧掉10万美元的ChatGPT努力搞钱:正式开放API,成本大砍90%,75万个单词仅收费2美元计划用ChatGPT做内容,美国新媒体巨头Buzzfeed股价一夜翻倍用ChatGPT做PPT,太爽了!(附赠3个网站,1分钟做出绝美PPT!)用ChatGPT做投资?人工智能正在改变私募游戏规则1天烧掉10万美元的ChatGPT正式开放API:成本大砍90%,75万个单词仅收费2美元ChatGPT背后的标注人:在非洲只管「鉴黄」,时薪不到两美元感谢信用ChatGPT做表格真香!只需动嘴提要求和复制粘贴7 Papers & Radios | GPT-4学会反思;ChatGPT数据标注比人便宜20倍ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!愚民的连花最低时薪仅9元,每小时或标注2万个单词…ChatGPT背后的“血汗工厂”曝光:有员工遭受持久心理创伤Scale AI:大模型还需要数据标注吗?金融民工会因为ChatGPT下岗吗?刚刚,我问了ChatGPT 24个金融圈灵魂问题能写作业、能写诗、能讲笑话,还能哄女朋友?!到底还有什么是ChatGPT做不到的???集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布ChatGPT要把数据标注行业干掉了?比人便宜20倍,而且还更准
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。