Redian新闻
>
ChatGPT标注数据比人类便宜20倍,80%任务上占优势 | 苏黎世大学

ChatGPT标注数据比人类便宜20倍,80%任务上占优势 | 苏黎世大学

公众号新闻
Pine 发自 凹非寺
量子位 | 公众号 QbitAI

又一“人类饭碗”被AI抢走,还是和训练AI息息相关的:

数据标注。

苏黎世大学研究发现,在ChatGPT面前,无论成本还是效率,人类可以说是毫无优势:

  • 成本上,ChatGPT平均每个标注成本低于0.003美元,比众包平台便宜20倍;

  • 效率上,在相关性、立场、主题等任务中,ChatGPT也是以4:1的优势“碾压”人类。

论文发出后,有网友调侃,“生成训练数据需要人工”的说法已经成为过去式了。

还有人直呼“古籍修复数字化工作是不是有希望提速了”。

还有人看热闹不嫌事大,直接发推称:

这是直接端了平台工作者的饭碗。

话说回来,ChatGPT是怎么抢了数据标注工作者的“饭碗”的?

ChatGPT在80%任务上占优势

首先得先了解下数据标注工作的具体内容。

简单来讲,数据标注就是给社交媒体上的内容数据贴标签,将其以不同主题或者概念进行分类,或是对其立场以及情绪进行判别。

这些经过标注的数据就可以用作NLP模型的训练集或是评估标准。

以往,这类工作都是交由人工处理的,比如说MTurk就是专门进行数据标注的一个众包平台。

在MTurk这类众包平台内部,还会有更加精细的分工,比如说会有经过专业训练的数据标注者以及众包工作者。

前者在产出高质量数据上具有优势,但自然成本也更高,而后者虽然更便宜但质量也会随任务难度波动。

于是研究团队就开始着手研究大语言模型(LLM)在这方面的潜力,并且对比了没有额外训练(zero-shot)的ChatGPT(基于GPT-3.5)和MTurk在数据标注上的性能。

这项对比基于研究团队此前收集到的2382条推文样本。

ChatGPT和MTurk分别将推文以“相关性、立场、主题、政策、实用性”这五种任务进行标注。

评估的标准有两条:

  • 准确性:ChatGPT和MTurk众包工作者相较于正确标注的百分比;

  • 编码者间的一致性信度:用ChatGPT、MTurk众包工作者以及专业数据标注者任意二者之间的一致性来计算;

结果呢也显而易见,在准确性上,ChatGPT有五分之四的任务都要优于MTurk众包工作者。

一致性信度上,ChatGPT全部任务都超过了专业数据标注者。

成本方面,开头也已经提过,ChatGPT平均每条比人工便宜20倍,何况AI还能24*7无休。

不过对于研究团队得出的这个结论并不是所有网友都买账,有人表示:

这五条任务都太单一了,难度也是。仅凭这一点就得出这样的结论可靠性存疑。

甚至还有网友嘲讽了起研究样本太少来:

(竟然)只用2382条推文做样本。

“饭碗威胁”不止数据标注

现在,AI会不会完全取代某一类工作还不好说,但它会在一定程度上影响人类工作是毋庸置疑的。

上周,OpenAI就发布过一份分析报告,称有80%的工作都会在一定程度上受到ChatGPT的影响,19%的岗位会受到ChatGPT的严重冲击。

并且薪资越高的职业受到的冲击就越大。

OpenAI还进一步列出了会被影响的具体职业,从大到小依次是:

翻译从业者、文字创作者(包括诗人、作家等)、公关人员、数学家、税务编制人员、区块链工程师、财务工作者、媒体从业者……

图源:OpenAI

除此之外,OpenAI的CEO奥特曼也不止在一个场合下说过“AI会取代现有的部分工作”。

前不久,MidjourneyV5大升级也是让不少人类画师直呼饭碗不保。

emmmmmm,你觉得你的饭碗还保得住吗?

论文地址:
https://arxiv.org/abs/2303.15056
参考链接:
https://twitter.com/arankomatsuzaki/status/1640521970608402435

【AIGC 技术探索与应用创新】

4月13日「掘金城市沙龙·北京站」

限量免费参会!

ChatGPT 看,AI 模型服务化趋势是怎样的?AIGC 新时代下,文本智能创作面临什么样的变革?如何轻松训练 AIGC 大模型?基于大模型的 AIGC 工作原理和应用场景是什么样?

畅聊「AIGC 技术探索与应用创新」字节跳动 AI Lab 算法工程师陈家泽、英特尔AI软件工程师杨亦诚、Google Cloud机器学习专家王顺、清华大学 KEG 知识工程实验室研究助理郑勤铠、九合创投 COO张少宇、稀土掘金江昪等多位业界专家已集结完毕!

4月13日下午北京大钟寺地铁站方恒时尚中心,邀你线下参会,更有多款稀土掘金原创周边等你来!

扫描下方二维码,抢线下免费参会票!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
斯坦福等学者对ChatGPT做了在NLP几乎所有任务上的优劣势分析马斯克AI实验室名字敲定/ Win11任务栏添加ChatGPT搜索/ 沃尔玛限制员工使用ChatGPT…今日更多新鲜事在此8 大分类、80+ ChatGPT 插件一网打尽,最全 ChatGPT 插件清单来了周末愉快 三菜一汤打败鹤岗,成为最便宜城市​:10万元买8套房!最便宜2000元一套,却有无数人逃离​集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇我为ChatGPT做数据标注后受到了“精神创伤”:月薪不到两千,每天标注20万个单词IBM加入战局!任意大模型低成本变ChatGPT方法开源,个别任务超GPT-4一次只要0.003美元,比人类便宜20倍!ChatGPT让数据标注者危矣ChatGPT长出狗身子!波士顿动力ChatGPT狗,说话、整理数据超级6英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM投资人竞相追逐的数据标注公司,能撑起国产ChatGPT野心吗?|数智前瞻不吉利与最坏的广告65岁知名浙商突发心脏病去世;ChatGPT被曝曾雇佣数据标注“血汗工厂”;华为再次回应:不造车丨邦早报突然出手!意大利封杀ChatGPT!马斯克也下场呼吁限制ChatGPT!AI发展可能超越人类思维?ChatGPT充当大脑,指挥AudioGPT解决语音、音乐、音效等任务当年那些日本电影和影星(二)7 Papers & Radios | GPT-4学会反思;ChatGPT数据标注比人便宜20倍ChatGPT要把数据标注行业干掉了?比人便宜20倍,而且还更准8大分类、80+ChatGPT插件一网打尽,最全ChatGPT插件清单来了ChatGPT 核心技术大起底——InstructGPT:研究人类反馈数据比加大模型规模更重要!下载量暴增10倍!微软必应集成ChatGPT后需求大爆发;4省份上调最低工资标准;淘宝已屏蔽ChatGPT关键词丨邦早报人类“3.0”意识形态战场——ChatGPT的政治化终局ChatGPT的价值观及立场(四)《财神到》给大家拜年啦!兔年吉祥!GPT-3核心成员出走打造ChatGPT最强竞品!12项任务8项更强,最新估值50亿美元碾压ChatGPT、自主完成任务、Star数超8万的Auto-GPT,是炒作还是未来?论宗教、偶像和社会:从基督教和佛教对偶像的态度说起千亿ChatGPT的狂欢和月薪3K的数据标注员苏黎世理工大学实现迄今最大规模的薛定谔猫态 | 量子科话ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!开源版ChatGPT来了?多数任务效果超越GPT3,已开源!ChatGPT已过时?Auto-GPT迅速走红,无需人类插手自主解决复杂任务,GitHub标星5万AI教父称人工智能正变得比人类更聪明,苹果谷歌起草追踪设备规范,微软将推私有版ChatGPT,这就是今天的其他大新闻。OpenAI 千亿市值背后:外包数据标注员月薪不到两千,每天标注 20 万个单词
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。