Redian新闻
>
我们有3亿道题,至少60家大模型要买|专访景联文

我们有3亿道题,至少60家大模型要买|专访景联文

科技

在人工智能日益崭露头角的时代,数据标注成为了支持AI系统学习和成长的关键环节。而在这一背后不太为大众所知的领域,景联文科技显然已经占据了一席之地。

这家企业不仅为全球的AI从业者和研究机构提供多元化的数据服务,还在医疗、教育等领域深度耕耘,打造出了专业题库和医学资料数据库。为了了解更多关于景联文科技的故事,娱乐资本论·视智未来采访了其CEO刘云涛。

景联文科技成立于2012年,是一家以人工智能数据服务和软件开发为主的科技企业。

 ---以下为采访实录--- 

视智未来:可以介绍一下你们公司吗?

景联文科技CEO刘云涛(下同):

2012年,我们看好人工智能赛道,成立了景联文科技,是一家以人工智能数据服务与软件开发为主的国家高新科技企业,为全球的人工智能从业公司和高校科研机构提供AI数据采集、数据标注、数据集产品、标注平台定制开发等服务。

视智未来:你们数据采集标注的主要业务范围是?

业务范围包括常规的算法模型训练需要用到的图像视频、语音、文本、点云等。此外,我们也投入了巨额成本在指纹数据采集和泛健康领域的心率、血氧、血压等数据采集业务上,目前全球几乎所有手机厂商、指纹芯片厂商、测试机构的指纹数据都来自景联文科技。

视智未来:你们在降本增效上有新举措吗?

内部降本上,我们通过自研智能标注平台和内部标准化管理系统的加持,提高内部的协同流程,将非标准化产品做标准化操作,降本增效。现在,2D拉框标注项目的成本降低了50%。

同时我们也一直深耕在数据领域的专业度,比如我们在AI医疗健康领域重点加大研发投入和设备投入,目前我们在该领域可以说是行业专家。

视智未来:你们有客户分类吗?

数据采集标注是非标准化产品,小客户和大客户相比,订单量和收益都相差很打,经过一系列的沉淀思考和利润考核,我们更愿意选择在头部客户中做深耕。

视智未来:你们现在的数据标注员工的情况是?

现有景联文科技在全国有超过1000名全职标注人员,标注基地分布在杭州、衡阳、金华、武汉等。

随着AI行业快速发展,数据标注行业对标注员的学历等级、语言能力、理解能力,专业知识背景的要求都越来越高,比如语言标注团队要求会各种小语种,医疗标注需要医学院毕业的学生。

视智未来:工资的下限和上限能到多少?

只论标注人员,AI越来越智能,简单的标注项目越来越少,标注难度越来越高,每个采集标注项目的难度也不一样,工资上下限空间差距很大,上限能到11000,下限的话3000左右。

视智未来:人力成本占公司经营的多少呢?

40%人力成本,40%左右研发成本,剩下来20%综合成本。景联文科技已经从以前的纯人工标注,发展为目前AI算法预标注加人工标注审核的生产模式。不能把数据标注公司做成一个人力公司,但也不是像网上讲那么疯狂,说标注可以完全自注化,一万框一秒钟就能拉完。

视智未来:你们的壁垒是什么?

第一、目前大语言模型火爆,把我们点爆了。教育方面,我们手上有3亿道从小学、大学到职业教育的题,格式统一,解析维度包括专题分类、分析过程、考点解析、解答过程、教师点评等。医疗方面,我们也有超过400TB的医学资料数据库。现在大模型号称百模大战,至少有60家都要买我们的题库。         

第二是客户资源。市面上80%以上的科技企业、独角兽、上市公司,我们都在他们的供应商库里,这就跟其他新公司不一样。景联文有非常好的市场资源和客户资源。

第三是产品,在标注领域我们不断投资研发景联文智能标注平台。

第四是内部管理系统,景联文从一个项目客户进来,到最后项目结束是一整套的内部标准化的管理系统,能够实现降本增效。

第五是专业性,原来我们和同行公司对 AI医疗和健康领域的数据采集都不专业,三年前出现心率、血氧、血压这些数据业务,同行不关注,景联文科技关注,重点投研发、买设备,招投标时虽然同行都参与,但他们的价格永远比不过我们,因为这项业务他们做不了就要委托别人去做,成本就高,但我们是很低的,这就是核心竞争力。

视智未来:数据标注未来有哪些新机会和挑战?

数据要专业性和前瞻性,比如医疗大模型需要三甲医院的专家的病理数据,才能去做更高级的判断,否则这事儿就没有意义。前瞻性是要比其他人看的更远更长更快,比如我们两年前就开始拓展标注场景,选了医疗赛道,我相信不管经济多不景气,医疗始终有存在的意义和价值。

视智未来:政策方向你们有什么建议吗?

未来,中国的数据流通怎么更合规化、更安全化是很大的问题,现在很多城市也在建立大数据交易中心,是积极的信号。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
性能全面超越LLaMA2,0门槛商用,这个国产大模型要改变开源竞争格局了刚刚判了!纽约华裔医生被控50项强奸、x侵、非法监视等罪!涉嫌迷奸至少6女性还拍视频...面临25年至终身监禁突发!这国连发恐袭,至少64人丧生这国首都突发爆炸,至少6人死亡科研上新 | 大模型推进科研边界;大模型的道德价值对齐;优化动态稀疏深度学习模型;十亿规模向量搜索的高效更新《呼啸山庄》重译09B小心毒草Helmlock(毒芹)珍珠塔的回响十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型3秒出标题,15秒出简介,30秒出一整本少儿绘本|专访ImageStory可怕!洛杉矶一男子专门去墨西哥奸杀妓女,至少有3名妓女遇害无耻!悉尼华人男教师偷拍女学生私处,被判至少6个月监禁!有学生曾差点发现偷拍手机!北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型[干货] 一道题,妥妥搞懂句子成分!大模型要落地产业,提高性价比是关键|甲子光年至少67人遇难千人失踪!中国驻洛杉矶总领馆紧急提醒→10道题,检测你和朋友的亲密程度有些东西如果不品尝就很难解释录取结果陆续公布:你高考错的那道题,也许错得刚刚好中山医院团队开发AI模型实现糖尿病血糖精准调控,已获批Ⅲ类医疗器械,正注册临床研究落地|专访陈颖传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报AIGC的数据标注订单雷声大雨点小,大模型不好用正常|专访汇众天智给病人打麻醉针后强奸!华裔医生涉嫌迷晕强奸至少6名女性,全部都拍了视频,被作为呈堂证供马斯克这人,至少有5种人格|独家专访震惊!华裔医生涉嫌迷晕强奸至少6名女性,全部都拍了视频,被作为呈堂证供中国LoRa产业链企业已超3000家,我们对未来保持乐观|专访Semtech数据标注本质是高级搬砖,我们还不如工厂|专访飞火女性或是目标,洛杉矶男子被控袭击至少6人,实施性侵抢劫突发!澳洲一军车与多车相撞,起火爆炸!现场浓烟滚滚,至少6人受伤!警方已紧急封锁该区域小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大谷歌证实大模型能顿悟,特殊方法能让模型快速泛化,或将打破大模型黑箱AI大模型要革AI的命周末随笔大华股份殷俊:大模型要让行业敢提需求,产业侧落地才是发展重点咱就一对耳朵到底要买几副耳机啊?还要买耳夹啊?买,而且好看!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。