「柏川数据」获千万元天使轮融资,强化以自动化标注为核心的数据智能服务|36氪首发
数据标注,从劳动密集型向技术驱动转变并非一蹴而就。 |
编辑|王与桐
36氪获悉,苏州柏川数据科技有限公司(以下简称:柏川数据)近期已完成千万元天使轮融资,由同创伟业独家投资。本轮融资将主要用于技术研发和团队搭建,进一步提升公司市场占有率。
柏川数据成立于2021年,是一家聚焦自动驾驶AI数据服务的科技公司,主要面向主机厂、自动驾驶解决方案商提供数据采集、清洗、标注、管理、存储的一站式服务,覆盖单车智能、车路协同、智能座舱三大场景。同时,柏川数据表示,本轮融资后,公司将把在自动驾驶领域积累的AI视觉场景处理经验复用至AIGC、智能机器人、智慧工业、智慧城市等多个领域。
自动驾驶步入L2+时代,数据标注需求、标注维度和复杂度的增加,推动数据标注行业从劳动密集型向技术驱动转型,自动化标注技术备受关注。
“现阶段,加速布局自动化标注,提高自动化标注的准确率,是提升技术壁垒、实现差异化竞争的核心。”马东升告诉36氪。但同时,他认为,目前行业整体仍然处于转变的过渡阶段,组建并高效管理人工标注团队,保障标注团队持续稳定输出,依旧是大规模、高质量交付的关键。
因此,柏川数据的做法是,采用人工+AI辅助的标注方法,并制定分步走策略。
据介绍,公司现阶段的重心一是持续打磨闭环运营管理体系,提升生产服务的效率和质量;二是,构建数据闭环系统,打通数据采集/存储、预处理、标注、仿真、模型训练/部署等数据处理环节。同时,马东升表示,在这个过程中,公司将逐步加大对自动化技术的投入力度,把积累的场景、数据和工程化落地经验,应用于自动化标注AI模型的研发,提高自动化标注的准确率和自动化率。
具体而言,一方面,柏川数据搭建了包括覆盖人员筛选、培训、标注、质检的闭环运营管理体系,并自建了上千人的标注团队。针对标注项目,公司会拆解为「标准化」和「非标准化」两个部分,由自营团队负责完成个性化和定制化程度高、标注难度大的非标业务,并将重复性高的标准化业务交由公司强管控的外包团队处理。在作业过程中,柏川数据会进行多轮质检,包括全轮质检和抽检,以保证自建团队和外包团队作业质量的一致性。
马东升认为,对数据和任务的拆解有助于实现自动化标注AI模型训练的降本增效。他告诉36氪:“随着场景的持续积累,我们的拆解能力将不断提升,拆解的颗粒度会越来越细,可以进一步提高服务效率。”
另一方面,柏川数据建立了场景驱动的数据管理SaaS平台,贯穿数据采集、清洗、标注、管理、存储的全流程。据介绍,该平台配备了多类数据管理工具,集合了可视化数据、人员管理、绩效管理等功能,可进行脱敏、抽帧、融合、索引等数据预处理工作,并支持包括BEV和4D的各类数据处理任务。
在自动化标注能力方面,马东升表示,平台目前支持绝大多数工况、天气、车道情况下的AI辅助标注,自动化标注精准率可满足大规模交付需求,部分场景在自动化标注辅助下可提升数十倍的标注效率。
“自动化标注要解决的是行业里不同客户、车型、路段、场景的自动化识别问题,这意味着自动化标注的AI模型同样需要海量且高质量的数据进行喂养。”马东升告诉36氪,“我们目前已经沉淀大量的高复杂度、高价值自动驾驶场景,支持场景驱动的自动化标注研发。”
据介绍,截至目前,柏川数据已累计服务于超30家客户,包括多个行业头部主机厂、全栈式解决方案提供商、关键部件供应商,以及商业化场景提供商。
自建团队的好处是,柏川数据可以把控数据质量和交付周期,但也会带来比其他运营模式更高的成本。对此,马东升表示,高成本的回报是更高的服务质量和客户粘性。为降低成本,柏川数据正进一步优化平台工具链、提升运营管理效率。针对后者,柏川数据吸纳了多名曾在华为、百度、富士康、宝马等大型科技企业有过多年从业经验的成员,并组成了具备丰富产业背景、管理经验的核心管理层团队,以支撑后续业务拓展。
谈及竞争,马东升表示,由于自动驾驶算法仍在迭代升级,同时AI大模型正处于快速发展中,数据标注需求呈上升态势,市场处于供不应求的状态。因此,公司目前希望在大规模稳定交付的同时,一方面,基于端到端数据服务拓展更多差异化业务,比如仿真场景库业务,以进一步打通数据闭环;另一方面,持续跟进算法公司、研究院的最近技术进展,利用训练好的数据迭代优化算法模型,完善工具链,进一步提升自动化标注技术水平。
然而,多元业务可能带来的一个新的挑战是新老业务发展的平衡:公司既要在自动驾驶领域做深,还要解决新业务新场景下的新问题,比如大型语言模型相关标注任务对标注员素质提出了更高要求。
马东升坦言:“明确集中优势兵力打哪一块领域至关重要,但可以确定,自动驾驶仍然是公司的核心聚焦领域。对其他领域,比如机器人、AIGC我们已经有一些客户合作案例,但未来会有选择地拓展新业务,综合考量客户体量、供应商友好程度、行业影响度等因素。”
投资人观点
同创伟业合伙人童子平表示:“在海外,Scale AI已经成为行业独角兽,占据了绝佳生态位。但国内自动驾驶数据服务这一细分赛道的竞争格局尚未完全形成。柏川数据凭借在商业模式、产品技术、运营管理、行业积累上的优势,有望在自动驾驶数据服务领域中厚积薄发,成为该赛道的翘楚。这也是我们投资柏川数据的根本出发点。”
同创伟业董事总经理陈悦林表示:“自动驾驶将在未来持续释放AI基础数据服务需求,不过行业门槛也将不断拉高,服务质量、服务效率以及数据Know-How将成为关键考量标准。我们看好柏川数据的综合竞争实力和未来发展潜力,并相信柏川数据会占领市场制高点。”
独家、深度、前瞻,为1%的人捕捉商业先机
36氪旗下创投公众号
微信扫码关注该文公众号作者