Redian新闻
>
「恺望数据」获新一轮战略融资,以「自动化产线+规模化人力」提升数据标注效率|36氪首发

「恺望数据」获新一轮战略融资,以「自动化产线+规模化人力」提升数据标注效率|36氪首发

公众号新闻

上线一年,已搭建一条“自动化产线”,单月订单已超过千万元。

邓咏仪
编辑苏建勋
来源36氪(ID:wow36kr)
封面来源IC photo

36氪获悉,数据标注解决方案公司“恺望数据”近日已完成新一轮战略融资,投资方为全球投资机构Plug and Play,天使轮投资方辰韬资本继续追投。

本轮融资投资方为璞跃中国(Plug and Play China),公司曾成功早期孵化Google,投资PayPal、Dropbox等多家科技巨头公司。恺望数据表示,新一轮融资后,恺望数据也会与PNP进一步合作,探索出海路径,并继续投入到产品迭代升级当中。

人工智能赛道的发展离不开大量人力和数据的哺育,而数据标注产业正是在AI产业链的上游——将大量的数据分类、标注,为AI公司提供经过加工的数据“原材料”。

“恺望数据正是起家于自动驾驶领域,为车企和自动驾驶公司提供一站式数据解决方案的公司。恺望数据创始人于旭硕士毕业于法国昂热大学,曾从0到1搭建起字节跳动、Momenta、Uber等企业数据生产及运营体系。

恺望数据希望能够解决数据标注行业供给不稳定、流程繁杂、工具低效等数据标注行业痛点。

自2022年2月成立后,恺望数据花费一年时间,建起起了一套以“自动化产线+规模化人力”为核心的生产体系。其形态为一个SaaS平台——相当于一个能够为算法提供稳定、高质量且低价数据供应链的"自动化产线"。而本轮融资完成之际,这一产线也已正式上线。

传统的数据标注行业,是一个人力密集型行业。在传统的数据标注厂商中,除了招募大量标注员外,还有大量的统筹、管理工作。而要做到“自动化产线+规模化人力”,恺望数据主要分为两部分来实现——首先建立了SaaS平台,拆分成管理和生产两个部分。

在前期的培训、第一道标注、审核等管理环节,以往很大程度都要依靠项目经理来进行统筹、编排,恺望通过建立统一的SaaS平台和规则,将这一部分数字化。

到了生产环节,恺望的SaaS平台已经内置了一套类似打车的机制,标注员能够在上面“接单”。值得注意的是,恺望在这一环节还引进了ChatGPT相关技术,用以提升数据标注作业流程的管理效率。

事实上,大模型技术的突破也让数据标注厂商迎来一次“产业升级”。创始人于旭对36氪表示,以往在数据标注中,大量数据都需要预标注,也即需要人工手动标注出来,再教会机器。数据厂商也会遇到不同厂商的任务,小的机器学习模型不能太适配的问题。但如今随着技术迭代,尤其是近期的大模型技术突破后,这将能够作为数据标准的基础。

“以前,如果人类用10分力,现在大模型能够贡献6-7分,把通用的数据都标注好,省下来的时间,人工可以重点投入到一些垂类场景的数据种类中。”于旭表示。

比如,近期Meta公布了用于图像分割的大模型——这就是自动驾驶中重要的一个标注环节。在以后,大模型可以用于CV(图像)方向的的预筛,到后面更为垂类的数据种类,再由人工来完成。

在上述种种的数字化技术升级下,恺望的“数据标注产线”实现了在持续提升数据生产规模化的同时,减少成本20%-50%。

技术提升也会加速人才培育的门槛。于旭认为,配合自动化产线,数据标注所需要的人才水平也会逐渐走高。从去年开始,恺望数据就推出了人才培训计划,与高职院校进行合作,希望培养有基础标注知识的人才。

在以前,一个零基础的学生,需要经历约为三周的“爬坡期”,背诵相关标注规则。而恺望将ChatGPT和规则库进行结合,引进到标注作业平台后,标注员在进行标注时,就能通过对话形式询问GPT助手,标注员再也不必背诵大量的规则,人才培育的“爬坡期”大幅减短。

这也同时解放了项目经理,他们不必同时管理资源、项目、培训等环节,其管理范围也会扩大。“随着AI行业这一轮产业升级,人才梯度会迅速分开,而数据标注领域也将会进入精细化分工阶段。”于旭表示。

从市场需求来看,2022年是自动驾驶行业纷纷进入量产阶段的一年,对数据标准的需求呈现爆发状态,算法迭代快,对每一批数据的质量要求越来越高。于旭表示,成立不到一年,恺望数据已经进入业务快速增长期,当前已经与三一集团在自动驾驶领域开展数据合作。

此外,恺望也与字节跳动、元戎启行、地平线、中交兴路、辉羲、易控、旷视及商汤科技等企业建立合作。近期,恺望单月订单已突破千万级别,并中标汽车主机厂长安汽车的数据标注服务。

除了自动驾驶领域外,恺望数据也在探索AI领域的市场机会。在最近半年的AI热潮席卷下,可以预见的是,对产业链上游的数据需求正在爆炸性增长。根据中国信通院,到2035年,全球数据量将达2142 ZB(Zettabyte,1ZB约十万亿亿字节),是2020年数据量的约45倍。随着AI所需的数据量和训练精度也逐渐走高,这对数据标注、算力优化等基础设施服务提供了更高要求。

此前,恺望数据曾于2022年9月宣布获得千万级天使轮战略融资,投资方包括辰韬资本、三一集团和溪山天使汇。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
「北云科技」获数亿元战略融资,博世创投、长城、星航、吉利系基金等参与投资丨36氪首发「爱博医疗机器人」获1亿元A轮融资,加速泛血管介入手术机器人商业化|36氪首发「深度智控」获数亿元A轮及A+轮融资,打造新一代深度节能智控产品与解决方案|36氪首发建筑机器人「筑橙科技」获近亿元A轮融资,2023年将规模化落地|36氪首发幼托连锁品牌「幼蒙考拉」获数百万元Pre-A轮融资,切入需求旺盛的普惠托育市场|36氪首发AI驱动运筹优化「光刻机」!中科大等提出分层序列模型,大幅提升数学规划求解效率|ICLR 2023汽车软件公司「艾拉比」获B2轮融资,上汽集团旗下尚颀资本投资|36氪首发绝美挪威荷兰夏日之旅(十五)Stegastein观景-峡湾小镇Flam「焕智科技」获数千万元A轮融资,打造以AGV为核心的仓储智能物流系统|36氪首发电商数据服务企业「EchoTik」获数千万天使轮融资,要做海外版生意参谋|36氪首发「宇称电子」获长城资本战略融资,希望以集成芯片方式降低激光雷达成本|36氪首发「恺望数据」获新一轮战略融资,以「自动化产线+规模化人力」提升数据标注效率|早起看早期「元上科技」获千万级天使轮融资,「XR+文旅」场景推进落地中|36氪首发「极赫科技」获近千万元天使轮融资,旗下神霄平台助力XR行业应用拓展|36氪首发「索迩电子」获近亿元A轮融资,提供软硬件一体化的触觉反馈解决方案|36氪首发屋顶太阳能光伏发电「未来盒子」获千万级天使轮融资,搭建数字化快装产业互联网平台|36氪首发一个让ChatGPT读不懂的“马与爱”商用洗碗机租赁平台小格智能完成数千万元pre-A轮融资,主攻租赁自动化、智能化丨36氪首发晨跑主打IM场景自动化,「自然机器人」获顺为领投Pre-A2轮融资|36氪首发「卓镱辉」获数千万元A轮融资,以飞秒激光器落地半导体与光存储等领域|36氪首发「博信科技」获数千万元A+轮融资,用空中机器人助推光伏、锂电产线自动化|36氪首发细胞培养肉公司「极麋生物」获千万元天使+轮融资,培养基成本降为市面3%|36氪首发「先康达生命」获数千万元Pre-A轮融资,加速推进实体瘤CAR-T临床开发|36氪首发「天懋信息」获数千万元B+轮融资,由磊垚资本独家投资|36氪首发「埃林哲」再获A1轮战略融资,由崧源创投基金投资|36氪首发「中科微感」获千万级人民币天使轮融资,最新一代MEMS基气味传感器已实现量产|36氪首发「周子未来」获数千万元A+轮融资,加速细胞培养肉千升级规模化生产|36氪首发「奔曜科技」获A及A+轮约2亿元融资,加速生命科学智能自动化变革|36氪首发「智库智能」获数千万元A轮融资,聚焦托盘仓储机器人赛道,连续两年营收过亿元|36氪首发坎坷的欧洲游(3)「华迈电气」获数百万元Pre-A轮融资,提供降低电机设备用电量的解决方案|36氪首发「新势力」电动自行车品牌「VELOTRIC」完成A轮融资,推出高性价比产品|36氪首发「昇印光电」获过亿元A轮融资,创新研发非硅微纳米加工平台型技术|36氪首发
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。