Redian新闻
>
AIGC的数据标注订单雷声大雨点小,大模型不好用正常|专访汇众天智

AIGC的数据标注订单雷声大雨点小,大模型不好用正常|专访汇众天智

科技
在数字时代,数据标注逐渐成为人工智能产业的背后英雄。它是许多先进技术的基石,从自动驾驶到语音识别,都离不开它的支撑。
近日,娱乐资本论·视智未来专访了成都的汇众天智总经理骆靖元。汇众天智成立于2017年,是一家数字化服务提供商,为客户提供数据采集、标注、审核、验收等一站式服务。视智未来与骆靖元探讨了该行业相关的热门话题。从招聘背后的学历要求到行业内部的激烈竞争,从大模型的发展趋势到数据标注行业的兴衰变迁,这次的对话为我们揭开了一个鲜为人知的数据标注领域的面纱。

 ---以下为采访实录--- 


关于员工
视智未来:你们招人对学历要求高吗?
汇众天智总经理骆靖元(下同):
如果从全行业来判断的话,不太高,但是你从业务上判断的话。AIGC标注业务的公司基本一半是本科生。
大模型要有易用性,这要求标注员判断内容的时候,要有知识储备,逻辑判断能力。整体说标注工作挺无聊的,所以流失率比较高。
视智未来:新闻写宝妈是主流。
三年前、四年前可能这种还行,现在没法保证质量和效率,很少了。现在人工智能火后招人不用科普了,2017年京东的标注业务叫智能客服。
视智未来:今年2月GPT爆火,对你们影响大吗?
刚开始订单多了一些,可能整个社会都需要一个梦想,资本也需要炒冷饭。那时大公司的目的更多是为了割韭菜炒股价。后来大公司发现变现难,七八月份就很少在数据标注上投入了。实际上,我们订单量没有猛增,雷声大雨点小。
视智未来:做大模型不需要多做数据标注吗?
他靠以前原有的那些数据也能做大模型,如果市场反馈好再接着投钱,不好就不玩了。
这也说明了为什么AIGC出来的时候,数据标注业务没怎么增长,是因为他们并没有花钱来做这件事,而是找了国外现成的数据。
视智未来:你们现在竞争激烈吗?
激烈,公司有定期筛选的机制,比如说这批我需要10家公司。那我就从100个里面筛选,其中哪两三个不合适,我再动态替换。这使得一些公司不断报低价,恶性循环。
视智未来:你们接到的项目多是文本、图片吗?
图像、文本、语音三大类都会有,看团队更擅长什么。图片的话自动驾驶方面比较多。视频标注是抽帧成图片的形式做,应用在舆情监控方面。

关于行业
视智未来:你是怎么入行的呢?
我以前在京东做智能客服,后来回家乡出来单干了。
视智未来:从业多年,你有什么感受吗?
我们同事常说,当看到应用落地的时候,还是比较欣慰的事情。虽然工资低,但终归是做了点有用的事情。
视智未来:这几年行业变化大吗?
政府侧推动效果也不是特别理想。数据标注行业2015 、2016火,2017年开始热度下降。
像百度做了语音采集,高德、讯飞会再做一遍。算法都没变,标注都是新瓶装旧酒,同样一批人脸识别的图片,A公司做完B公司做,之后C公司再做,我们始终是在给别人做嫁衣。但这样的日子也好景不长,如今订单量变少,人员迅速增加后又会有断档期,大部分公司死在了断档期里。
视智未来:那能做数据中间商赚钱吗?
一个是数据属于客户,另外虽然说的是 100 张图,但不是同一批人的。
视智未来:你们的壁垒在哪里?
地域优势,人员成本其实不算高。管理能力,执行水平。数据保密的技术处理上。此外,我们有行业认可的学标组身份。
视智未来:你们行业为什么越来越卷呢?
门槛低是最直接的问题。
视智未来:你怎么看待行业发展呢?
人工智能的产品会越来越多,行业越来越好的时候,也会越来越透明,越来越卷。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
《呼啸山庄》重译09B数据标注员,困在大模型里|深氪Lite传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报汇智智能联合创始人刘黄骁烈:大模型应用正面临「GNOMIC困境」毛利率高达60%!智能驾驶降本「博弈」数据标注/训练服务中加复航声大雨点小? 温哥华回国机票涨 华人回家一绕再绕 这样买来回才2000刀……中山医院团队开发AI模型实现糖尿病血糖精准调控,已获批Ⅲ类医疗器械,正注册临床研究落地|专访陈颖别整天智商税了,智商税这东西很薛定谔「柏川数据」获千万元天使轮融资,强化以自动化标注为核心的数据智能服务|36氪首发靶向MDSC的策略(2):清除MDSC或诱导MDSC的分化ChatGPT时代,数据标注员还在搬砖|焦点分析实时分析、融合统一及云原生,现代化数据仓库未来发展必经之路|专访飞轮科技 CEO 马如悦英伟达订单“多到不可思议”,但 AI 大模型的故事已经不好讲了北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型AI数据标注迈入自动化时代,26年老兵掘金全球智能汽车市场GPT-4终结人工标注!AI标注比人类标注效率高100倍,成本仅1/7我们有3亿道题,至少60家大模型要买|专访景联文「柏川数据」获千万元天使轮融资,强化以自动化标注为核心的数据智能服务|早起看早期清华系大模型新秀获20亿投资;AI教父加入初创公司;套壳ChatGPT不是长久之计;百图生科拿下10亿美元大模型订单周末随笔数据标注本质是高级搬砖,我们还不如工厂|专访飞火有些东西如果不品尝就很难解释数据标注员,困在大模型里谁能最早看见AIGC的未来?专访昆仑万维董事长兼CEO方汉丨文娱行业AI巡礼360 周鸿祎:大模型不是「原子弹」,而是「AK47」小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大珍珠塔的回响寻找AIGC数据标注TOP玩家!中国AIGC数据标注全景报告案例征集启动大数据在大模型趋势下的“新姿态”:大模型与企业数据充分协同数据标注“流水线”里,藏着大模型的秘密日新100的数据标注有未来吗?太卷了!关于大模型和AIGC的36条笔记和真话雷声大雨点小,数据要素的商业化之路,还要走多久?小心毒草Helmlock(毒芹)重磅课程再次升级,一次性搞定大模型多模态AIGC与强化学习 --《2023秋季AIGC大模型与强化学习前沿技术实战》 招生简章
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。