【长期赛】安全AI挑战者计划第五期:伪造图像的对抗攻击
-
长期赛,现已开启~
1、报名成功后,参赛队伍通过天池平台下载数据,本地调试算法,在线提交结果。
2、2月18日起系统实时评测,每3小时更新排行榜,队伍一天内有10次提交机会;按照评测指标排序。
3、长期赛训练数据为2005张,测试数据为4000张图像,线上得分是选手提交的4000张mask的F1和IOU两个得分的总和,每张图像分数为2分,总分8000分长期赛激励:
1、本比赛为长期赛,无奖金,旨在为大家提供一个实战环境,提升算法能力。
2、长期赛中的优秀提交者和排行榜前列的同学,将收到阿里安全送出的精美定制礼品+200元天猫超市购物卡,并有机会受邀参加,挑战者线下颁奖典礼。背景
随着流量识别、人脸识别、动作识别、假货识别、假图识别等应用场景的出现,AI与安全结合的成果愈加丰硕,但AI面临的安全问题也逐渐浮出水面。
为了抵御未来AI面临的安全风险,阿里安全联合清华大学,以对抗样本为核心,提供场景、技术、数据、算力等支持,召集“挑战者”以防守者的身份共同打磨AI模型安全;为广大安全爱好者提供数字基建安全的试炼场,在高难度的真实环境中提升技术,培养真正有安全实战能力的安全基建人才。
安全AI挑战者计划的最大特点是,以系列竞赛贯穿全年,主打高难度、高创新、高趣味、高回报的题目任务和运营玩法。每一期差异化的呈现,既满足年轻技术爱好者猎奇求新的偏好,又激发了选手剑走偏锋的奇思妙想,将思路方法持续的沉淀到技术社区,将互联网大企业、优秀科研院校的私有经验公有化,每一期都能够实现超预期的累加技术成就。
2019年8月-2020年6月,安全AI挑战者计划成功举办了第一期人脸对抗识别比赛、第二期ImageNet图像对抗比赛、第三期辱骂场景文本对抗比赛、第四期通用目标检测的对抗攻击;吸引全球200多所高校100多家企业的4000支队伍参加。
更多学习资料和玩法福利,请至【安全AI挑战者计划】官网查看。
https://s.alibaba.com/challenget赛事介绍
比赛玩法
安全AI挑战者计划今年计划举办四次,每次主题各不相同。比赛开始后,赛事平台会对外开放相关接口,选手可以通过向接口提交恶意样本,来攻击AI引擎,使之产生误判。比赛将从文字、图像、视频、声音等多个领域设置题目,有target类型的题目也有non-target类型的问题,主办方也将在每新一轮变化相关模型。
参赛对象
面向全社会开放,高等院校、科研单位、互联网企业等人员均可报名参赛。
注:大赛主办和技术支持单位如有机会接触赛题背景业务、产品、数据的员工,则自动退出比赛,放弃参赛资格。赛题简介
赛道1(10月4日10:00AM (UTC+8)结束)
随着各种P图工具的普及,篡改伪造出视觉无痕迹的假图门槛大幅降低,于是我们看到大量的假图用于散播谣言、编造虚假新闻、非法获取经济利益,更有甚者,还可能会被用来恶意地充当法庭证据。图像取证正是用于检测篡改伪造图像的技术,经过十多年的发展,已经在新闻、司法、刑侦等领域广泛应用。但是随着各种反取证技术的出现,图像的真伪鉴定问题进入到了攻防双方博弈的阶段,到底是“道高一尺”(取证技术),还是“魔高一丈”(反取证技术)呢?为了发现现有图像取证技术的不足,推进图像取证技术在更广泛领域的应用,我们将举办全球首个针对证件资质文档类图像的伪造图像对抗攻击竞赛。区别于以往的图像取证比赛专注于自然内容图像,我们更关注能够用于表征权利人权益的证明材料图像。比赛采用的数据为证书文档类图像,其中包括10类不同图像。任务是通过对原始图像的特定候选区域进行伪造篡改(P图),做到视觉无伪造痕迹,并且让我们提供的图像取证模型无法识别篡改。为了更好的评价选手的攻击效果,我们设计了全面的得分计算准则。除了加入攻击成功率之外,我们还对伪造篡改的像素面积和图像视觉质量进行了约束。
赛道2(长期赛赛题)(10月12日10:00AM (UTC+8)开启,赛道1报名选手无需重复报名)
伪造图像的对抗攻击比赛的赛道1——攻击比赛已经接近尾声,很多高质量的P图不但骗过人眼,还成功骗过我们提供的4个经典检测模型,那是否就真的是“魔高一丈”(反取证技术)呢?我们的对抗攻击比赛开始进入赛道2——检测比赛将在10月12日10:00AM (UTC+8)拉开帷幕!设计出“火眼金睛”(检测算法),把别人的“挖坑”(篡改区域)一一识别出来。区别于以往的图像取证比赛专注于自然内容图像,我们比赛采用的数据为大量伪造的证书文档类图像。任务是通过提供的训练集学习出有效的检测算法,对测试集的伪造图像进行篡改定位。为了更好的评价选手的检测定位效果,我们设计了全面的得分计算准则。本次比赛对于参赛选手是个前沿且有挑战的领域,针对伪造文档资质类的图像取证技术仍未被深入研究。参赛选手挑战图像取证技术,获取宝贵经验的同时,也可以进一步钻研,把在比赛中的一些经验和技巧转化为学术论文,工程和学术两不误。
数据形式
赛道2(10月12日10:00AM (UTC+8)开启)
数据包括训练集和测试集,训练集有1500张JPEG图像及对应mask(分辨率与原图保持一致,像素值0表示该像素标识为未篡改,像素值1表示该像素标识为篡改),JPEG图像的EXIF信息均被擦除,除部分无后处理外,其它可能经过裁边、平滑、下采样、社交工具传输(没有使用组合方式);测试集有1500张JPEG图像,处理过程与训练集一致;允许使用集外数据进行训练学习。
参赛者提交数据时,利用我们提供的python程序生成mask,对1500张mask图像打包上传。
篡改图像可能包括如splicing、copy-move、object removal等任意操作,部分进行后处理(JPEG压缩、重采样、裁剪边缘等)。
不需要考虑图像的元数据(已经被擦除)。
禁止把本队伍提交的图像数据与其他队伍进行共享,经后台程序检测,一经发现,直接取消成绩。