打破自动驾驶数据标注的「手工模式」,博登智能获数千万元天使轮融资丨早起看早期
36氪获悉,博登智能近日宣布完成数千万元天使轮融资,投资方为浙江见识创业投资管理有限公司等。融资将重点用于“自动驾驶-自动标注算法”的持续升级与开源数据集建设。
博登智能是一家自动驾驶数据闭环工具链供应商,通过自研的数据闭环工具链,结合AI算法的自动标注能力,开发了具有完全自主知识产权的智能驾驶数据处理平台,可提供支持覆盖市场上95%以上传感器驱动的数据采集、存储,预处理,标注,模型训练/部署等整套数据处理流水线系统,形成数据闭环。
一直以来,数据处理行业被普遍认为是一个利润率低、高度依赖人工的“苦力活”行业,发展前景极低。随着自动驾驶向L3、L4推进,据英特尔推算:每辆车每天将产生的数据量将高达4000GB。这将大幅扩大基础数据服务市场的空间。
但高度依赖人工的标注模式,在海量数据面前行不通。博登智能创始人兼CEO赵捷认为,“数据作为自动驾驶的生产要素,一定要靠自动化实现效率的大幅提升,传统的人工标注模式生产效率是有极限的,未来将无法满足需求。”
高效标注,成为博登智能的产品切入点。其核心产品BASE标注平台,是集数据标注、项⽬管理、⼈员调度、流程配置、进度统计、算法训练为⼀体的⼀站式智能数据服务平台。最新BASE V4.0版本,已迭代为采用图⽚状态管理模式,引⼊Potree提⾼3D点云加载速度。
BASE标注平台图片
与业内同类公司相比,博登智能积累了自动驾驶方面的know-how。创始人兼CEO赵捷具有自动驾驶方面的实验室背景,并为宝马德国做过自动驾驶数据中心的搭建。公司成立至今,已累积获得6项专利和16项软著。
将公司优势作用于产品上,BASE标注平台所具备的数据处理能力,能更加紧密贴近整车厂的实际需求,帮助客户降本增效。相较于传统的纯人工标注方式,可以节省30-40%的成本,并提高30%的处理效率。目前,该平台已与国内龙头车企等企业达成长期合作,项目估算超两千万。
通过图片标注产能对比,可以明显看出博登智能自动化标注与人工标注的差距。以3D图片为例,AI全自动标注的日均产能为>20k张,而人工标注的日均产能为>10k张。
不同标注之间的产能对比
据赵捷介绍,支撑该数据处理平台的背后,有三大技术关键。
在数据采集和标定方面,博登智能拥有自己的数据采集、传感器标定软件,可将数据采集软件搭载在车辆上,在采集数据的同时对于数据进行脱敏、场景识别等预处理,减少冗余数据的存储。
在AI数据处理软件方面,随着海量数据的不断产生与流入,会促进博登智能的数据处理闭环系统进行不断迭代,自动解决智能驾驶所涉及的海量场景问题。
在自动化闭环系统方面,通过建立对新需求“自动化发现、记录、标注、训练、验证”的闭环过程,可为产品自身提供自动化迭代能力。
为实现这些技术难点,赵捷说,“前期公司已投入大量精力进行算法研发,并及时将这些技术突破转化为知识产权。在与主机厂合作中,不断拓展服务能力,如新增的传感器标定业务目前已接到量产订单,这也为自动化闭环系统的构筑带来帮助。”
根据IDC发布的报告,到2025年,中国人工智能数据采标服务市场规模将达到123.4亿元人民币。
在这样的市场前景下,博登智能计划在2-3年周期中重点发力无监督数据处理方法,建立独有的数据集,以省去标注成本;从长期主义的视角出发,博登智能将持续专注于高附加值、有技术门槛的产品创新之路。与此同时,在数据闭环的服务过程中,将深挖在自动驾驶领域中的机会。
未来,随着自动驾驶领域的感知场景不断丰富,要处理的数据类型已包括2D图像数据和3D点云数据,行业进入门槛进一步提高。据了解,L3级别以上自动驾驶需要大量的3D点云数据支撑,而3D点云标注不仅要求对激光雷达回传的数据进行实时处理分析,大量的弯道车道线、日积月累的消耗和损坏带来的形状和反射率失真问题,也为识别准确率带来极大的挑战。这些都将对数据标注公司的技术迭代与创新能力提出更大考验。
与此同时,目前行业中Scale AI 、四维图新、海天瑞声等玩家已纷纷在自动化系统、高精地图等方面发力,也使等未来市场竞争加剧。在“老玩家”的规模效应与产品精度不断提升的压力下,无疑将给新入局者带来更大的发展挑战。
博登智能核心团队:
博登智能创始人兼CEO赵捷博士拥有智能机器人专业背景,曾任德国汽车行业Tier1企业核心算法高级工程师,并在智能汽车领域深耕十余年,参与开发多款量产智能驾驶项目(如2019款宝马5系等);首席科学家赵万磊为厦门大学模式识别实验室教授,拥有多项计算机视觉、图像检索等领域关键科技成果。
微信扫码关注该文公众号作者