「Datablau」完成B1轮融资,探索AI大模型在数据治理核心业务场景应用|早起看早期
越来越多行业、企业的数据治理需求从“头痛医头、脚痛医脚”转向体系建设。
文|沈筱
编辑|王与桐
来源|36氪Pro(ID:krkrpro)
36氪获悉,北京数语科技有限公司(以下简称,Datablau)已完成B1轮融资,由考拉基金领投,老股东线性资本继续跟投,指数资本担任独家财务顾问。本轮融资后,Datablau将继续加速重点产业布局,构建基于大模型的数据资产智能平台,进一步将AI技术与数据治理核心业务场景融合。此外,Datablau也已制定上市计划。
Datablau成立于2016年,是一家数据资产管理软件和服务提供商,主要面向企业提供从事前模型管控,到事后数据资产盘点,再到数据资产价值输出的全栈式数据治理产品和咨询实施服务。据介绍,公司此前已完成天使轮、Pre-A轮、A轮,A+轮共计四轮融资,投资方包括中经合集团、广发乾和、线性资本、红杉中国。
自上轮融资以来,Datablau主要在产品和市场两个方面取得了较大进展。Datablau创始人兼CEO王琤介绍,迄今为止,公司已构建了较完整的产品矩阵,完成了产品市场验证和关键行业客户拓展,并于2021年进入规模化商业复制的新阶段。
具体而言,产品层面,Datablau在2021年正式完成Datablau DDM(数据模型管控平台)、DAM(数据资产管理平台)、DDC(数据资产目录服务平台)、DDS(数据安全管理平台)四大平台布局。今年已发布至6.5版本,在对原有功能优化迭代的同时,增设了部分新功能模块,并实现了平台对信创生态的兼容。
其中,DDM和DAM是Datablau的两大核心产品。DDM旨在帮助企业实现数据源头治理,通过模型工具,将数据标准落地,从源头规范化管控元数据的设计成果;依托数据模型和知识图谱,DAM可实现自动盘点数据资产,自动执行数据检测和生产质量问题报告。
DDC和DDS则是在上述核心底座产品基础上衍生出的产品线。DDC是在企业实现数据治理和资产盘点基础上,用以赋能业务部门进行数据资产搜索的平台。企业可基于统一数据授权,统一提供数据资产服务,打造数据应用;基于DDS,企业可以建立数据安全管理体系和个人隐私保护,对数据进行智能分类分级,动态脱敏,实现千人千面的数据供给。
良好的数据治理是企业走向数字化、智能化的必要条件。在Datablau看来,其构建现有产品矩阵的逻辑就在于,以数据模型为核心帮助企业搭建数据治理平台体系,从数据生产规范化、数据管理运营智能化、数据服务统一化三方面建立数据综合能力,进而实现数据业务化,提升数据应用能力。
王琤认为,注重体系搭建、提供完整的数据资产管理能力和智能化也正是Datablau与友商角逐数据治理市场的关键。“相较于解决方案友商,我们更多关注产品本身,而非清洗数据、建数仓。而和同样关注产品和工具的友商相比,Datablau的差异化主要体现在体系化的产品布局和AI技术应用方面。”王琤向36氪表示,依托人工智能技术,公司的DAM、DDC产品已经帮助大量客户显著提升了数据资产盘点和咨询实施的效率。
市场方面,伴随产品线扩张,Datablau于2020年开始进行横向市场拓展,将业务范围从金融拓展至零售、智能制造、能源、政府、物流、教育等多个关键行业。在落地标杆客户,提升公司在上述行业头部企业中市占率的同时,Datablau也陆续与阿里云、华为云等生态伙伴达成合作。2022年,公司正式与华为云达成框采,逐步推进平台化发展,将业务延展至中腰部客户。
王琤表示,目前,Datablau已累计服务包括中国人民银行、建设银行、中国人寿、中信集团、华为、美的、徐工集团、顺丰科技等200余个大型企业客户;2022年公司营收同比增长超180%,今年上半年也已同比实现营收成倍增长。
复购方面,王琤告诉36氪:“部分企业客户采取隔年采购的方式,复购率能保持在60%左右,但公司整体还处在增量市场中,除了老客户的增购,每年有一半以上的客户是new booking。”
近年来,在企业自身转型升级需求,和国家政策层面鼓励激活数据要素潜能、促进数据流通,这两方面因素共同推动下,国内数据治理市场稳步发展。根据IDC近期公布的《中国数据治理市场份额,2022》,尽管受疫情影响,2022年数据治理市场增速下降,但数据解决方案市场规模相较2021年仍同比增长了7.4%。而当前,人工智能技术又进入了新的发展阶段,作为AI应用落地的前提,数据治理的重要性再次凸显。
据介绍,近两年,Datablau在基于深度学习算法不断对DAM、DDC产品进行迭代优化的过程中,收集了大量数据反馈,构建了相应的向量数据库,并沉淀了不同行业的数据标准和语料库。王琤表示,这为公司现阶段引入LLM(大型语言模型)升级相关产品、功能,优化用户体验奠定了基础。
王琤认为,数据市场正逐步走向成熟,越来越多的行业、企业客户对数据治理的需求正在从“头痛医头、脚痛医脚”转向体系建设。他表示,这是Datablau近年来跨行业市场拓展的基础,同时也为公司未来增长提供了动力。
谈及未来发展,王琤告诉36氪,行业目前仍面临两个挑战,也是Datablau谋求成长的重要着力点:
一是源端系统的规范性问题。越来越多的企业将业务系统数据模型设计和管控作为企业开发项目的重要管理措施。这就要求Datablau等数据治理平台来完成数据模型设计与开发一体化(DevOps、CI/CD)的集成;
二是,现阶段企业仍面临数据治理周期长、任务重的问题,Datablau需持续探索如何帮助企业快速实现数据赋能业务。据介绍,公司正在尝试类似Data Mesh业务驱动的数据治理方式,并在最近交付的几个项目中,得到了较好的效果。但王琤也表示,尽管近年来业务部门参与配合数据治理的意识在逐步增强,但要达到Data Mesh所主张的让业务部门自主进行数据治理,还太早。
另外,王琤指出,Gartner提出的Data Fabric也是值得关注的方向。他认为,active meta data(主动元数据)是Data fabric较核心的部分,这意味着将元数据采集到平台,建立好库表结构后,Datablau需要做更多深度挖掘的工作。“实际上我们已经开始实践Data Fabric理念,比如通过DDC实现的数据资产智能推荐。”王琤告诉36氪,“但未来还需探索更多功能,包括智能取数、拉数等。大模型的应用能再帮助我们增强这部分AI能力。”
团队方面,Datablau团队规模已经超过200人,产研和交付团队占比超过80%,核心团队来自数据专业领域CA Erwin、IBM、Teradata、Informatica等国际大厂。
投资人观点
考拉基金合伙人戴巍表示:“我们长期关注数字化带来的投资机会,而数据治理是数字化建设的基础需求之一。Datablau拥有先进的理念和丰富的经验,并打造出了标准化程度很高的产品矩阵,特别是其独有的数据建模工具,有望成为企业客户数据治理的核心基础设施。我们相信Datablau能够凭借其对数据治理的深刻理解和极具竞争力的产品,持续为客户的数字化建设提供优质产品和服务,保持在行业中的领先地位。”
线性资本董事总经理郑灿表示:“过去三年里我们看到了公司的飞速成长,产品得到不断升级,业务也得到良好发展。我们相信作为中国数据治理的一家领袖企业,数语能够更好地帮助大量的中国企业真正地理解和利用数据,做到数据驱动业务运营。”
本轮融资独家财务顾问指数资本董事总经理韦炜表示:“数据已经晋升为现代企业的核心生产资料,进而推动数据治理需求的井喷。Datablau团队作为行业领导者,依托先进的产品理念和扎实的技术基础,为各行业头部客户打造了标准化的全栈数据治理平台,全方位提升数据治理能力。在经济、资本环境充满挑战的环境下,公司逆势实现业绩、融资的快速突破也证明了赛道与业务的强确定性。”
36氪旗下创投公众号
微信扫码关注该文公众号作者