【ICDAR 2023 X 阿里安全】挑战赛正式启动!篡改文本分类和检测两大赛题!
【ICDAR 2023 X 阿里安全】挑战赛:篡改文本检测
这是一场有特色、奖励丰厚的赛事!
构建自有数据集,包含超过 15000 张电子商务场景图片 阿里安全联合华中科技大学、华南理工大学举办
近 10 万元奖金,数万元丰富奖品,等你来拿!
会议介绍
ICDAR 会议是文档分析与识别领域国际顶级会议,自 1991 年起每两年举办一次,涵盖了文档分析与识别领域的最新学术成果和前沿应用发展趋势,吸引了该领域全球顶尖的研发团队和专家学者的参加,ICDAR 2023 是其第十七届会议。ICDAR 2023 文本篡改检测学术竞赛(ICDAR 2023 Competition Detecting Tampered Text in Images)将于 2023 年正式开赛。
赛事背景
文本是人类社会中重要的信息载体,携带了许多重要信息。近年来,文档分析与识别领域快速发展,新兴技术层出不穷,应用于数字金融、电子商务、安全审核、智慧教育等各种领域,极大地方便了人们的生活。因此,能够防止文本信息被恶意篡改显得尤为重要,文本篡改检测也逐渐引发学术界与产业界的广泛关注。由于篡改手段的多样性、篡改文本的隐蔽性,文本篡改检测目前存在着众多难点,如篡改痕迹微弱、篡改文本与邻近文本高度相似等。种种难点对检测方法的精度和泛化性提出了挑战。
赛题介绍
由于文本包含重要信息,因此我们能够防止文本被篡改至关重要。事实上,句子中的一个小变化可能会严重扭曲整个承载的语义信息。然而,以往文献分析和识别的研究大多集中在检测和理解文本的内容上。它们的真实性很少被讨论,这引发了人们对日常生活中信息安全的日益担忧。
近年来,图像取证受到了学术界和业界的日益关注,旨在阻止恶意图像篡改。大多数研究集中于自然图像,其中被篡改的对象通常是人或汽车等物体。而由于文本的非结构化表示,篡改文本检测更具挑战性。例如,篡改区域可以很小(例如,段落中的字符);篡改区域和周围环境之间的对比度可能非常低。然而,以前的大多数工作都是基于私有数据集。开源数据集的缺乏也减缓了回火文本检测技术的发展。
因此,我们构建了一个相对大规模的数据集,即模拟电子商务场景的篡改图像文本(TTI)。这些图像是通过多种多样的来源拍摄的。它总共包含 19000 个文本图像,其中 15994 个图像使用多种类型的操作技术进行篡改,包括手动和自动方法。每个图像都用指示篡改位置的二进制掩码进行注释。
相应地,本次比赛有两个赛道:
(1)文本篡改鉴别:该任务需要模型判断输入的文本图像是否包含篡改文本,模型输出对应输入图像的分类结果;
(2)文本篡改定位:基于文本篡改检测任务,模型需要进一步获得篡改文本的定位结果。
我们希望数据集和任务能够帮助业界促进图像文本篡改检测的研究。
相关时间节点:报名、提交等
2023 年 2 月 15 日:比赛开始,训练和验证集发布
2023 年 3 月 15 日:测试代码提交(队伍每天有一次提交机会)
2023 年 3 月 20 日:测试代码提交截止和技术报告提交开始
2023 年 3 月 25 日:技术报告提交截止日期
2023 年 3 月 31 日:最终排名公布
注:除特别注明外,所有截止时间均为北京时间(UTC+8)相应日期中午 11:59:00。比赛组织者保留在认为必要时更新比赛时间表的权利。
赛事群聊二维码
(注:请报名参赛的选手务必扫码进群,所有赛事相关通知均会在群内第一时间发布!)
激励奖金
ICDAR 2023 图像篡改文本检测竞赛奖金总额为 87000 元。
【赛道一】
第一名:¥20,000
第二名:¥5,000
第三名:¥2,000
【赛道二】
第一名:¥40,000
第二名:¥10,000
第三名:¥5,000
第四—八名:¥1,000
每位进入复赛的选手都将获得精美礼品一份,其他优秀选手也将有机会获得各类奖品。
赛事官网链接
赛道一链接:
https://tianchi.aliyun.com/competition/entrance/532048/introduction
赛道二链接:
https://tianchi.aliyun.com/competition/entrance/532052/introduction
点击阅读原文,参与报名本次赛事!
微信扫码关注该文公众号作者