由国内领先智能文本处理企业达观数据,与上海市计算机学会联合举办的智能文档版面分析多模态数据处理算法竞赛正在火热报名阶段。
作为国内领先的智能文本处理企业, 达观数据已连续七年主办了全球性人工智能算法竞赛“达观杯”,邀请高校、科技型企业和自然语言处理爱好者,共同参与和研究实际业务场景下的人工智能技术问题。属文本处理领域第一赛事,累计吸引近两万名选手参赛,提交作品总数超三万件。为助力各位打榜达人更快速上手比赛,更高效优化模型,冲击决赛top榜,达观数据算法团队为选手提供了官方baseline以供参考。本届大赛的总奖金池 5.5W元,此外,排名Top50的选手将获得达观数据全职和实习工作的面试直通机会,优先录用。初赛还有“周榜单激励”奖、“"鱼跃龙门"奖、“梅开二度”奖等各项好礼等你来拿~还没有报名的同学点击参赛链接或点击阅读原文进行报名;比赛近期将举办线上培训,请持续关注!https://challenge.datacastle.cn/v3/cmptDetail.html?id=824&hmsr=cver
该baseline使用的是DINO模型,模型主要思路是将文档版面分析任务转换为一个纯视觉的目标检测的任务,通过模型提取图像特征,预测文档元素的box坐标和元素所属类别 ,达到版面分析的目的。baseline使用的是DINO论文的官方实现版本,基于此次比赛的数据,在官方提供的预训练权重基础上迭代训练。目前该baseline在A榜数据集上的Average Precision (AP)@[IoU=0.50:0.95|area=all|maxDets=100 ]为0.783。代码整体过程分为:模型训练、模型评估、模型预测、预测结果可视化。选手可进入赛事平台,自行下载baseline以供学习参考。论文地址 :https://arxiv.org/abs/2203.03605https://github.com/IDEA-Research/DINO
点击阅读原文,立即报名比赛!