iFLYTEK：X光安检图像识别2021挑战赛-人工智能-PHP中文网

iFLYTEK：X光安检图像识别2021挑战赛

P粉084495128

发布： 2025-07-18 11:41:34

原创

739人浏览过

本文介绍科大讯飞X光安检图像识别2021挑战赛非官方baseline。赛事旨在用AI辅助安检，任务是检测X光图像中12类物品。初赛提供带标注训练数据和无标注测试数据，复赛增加无标注数据等。还给出数据划分、用HRNet训练模型、预测及结果提交等步骤。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

iflytek：x光安检图像识别2021挑战赛 - php中文网

iFLYTEK：科大讯飞X光安检图像识别2021挑战赛（非官方baseline）

注意：本项目不提供赛题数据集，若训练，可通过上方链接从官网报名下载数据集

一、赛事背景

X光安检机是目前我国使用最广泛的安检技术手段，广泛应用于城市轨交、铁路、机场、重点场馆、物流寄递等场景。使用人工智能技术，辅助一线安检员进行X光安检判图，可以有效降低因为人员疲劳或注意力不集中带来的漏报等问题。但在实际场景中，因物品的多样性、成像角度、遮挡等问题，为算法的开发带来了一定的挑战。

讯飞看见X光智能安检信息化解决方案是针对安检场景推出的智能化、信息化解决方案，旨在将传统的安检业务场景，通过人工智能、大数据等先进技术手段进行赋能，辅助一线安检检查工作，为安检管理方提供量化数据与大数据预警等更多技术管理工具。

二、赛事任务

本次大赛以讯飞看见智慧安检提供的X光安检图像数据作为训练样本，参赛选手需基于提供的样本构建模型，对X光安检图像中的待识别物品进行检测。

三、数据说明

此次比赛分为初赛和复赛两个阶段，初赛提供1）带标注的训练数据，即待识别物品在包裹中的X光图像及其标注文件；2）不带标注的测试数据；复赛在初赛的基础上再提供1）无标注训练数据即包裹X光图像（其中有的包裹包含待识别物品）；2）部分待识别物品X光图像（无背景）。

本次比赛标注文件中的类别为12类，包括

刀（label为knife）、剪刀（label为scissors）、尖锐工具（label为sharpTools）、甩棍（label为expandableBaton）、小玻璃瓶（label为smallGlassBottle）、电棍（label为electricBaton）、塑料饮料瓶（label为plasticBeverageBottle）、带喷嘴塑料瓶（label为plasticBottleWithaNozzle）电子设备（label为electronicEquipment）、电池（label为battery）、公章（label为seal）、伞（label为umbrella）。

12类待识别物品的X光成像示意图如下图所示。

iFLYTEK：X光安检图像识别2021挑战赛 - php中文网

初赛提供的X光图像及其矩形框标注的文件按照数据来源存放在不同的文件夹中，图像文件采用jpg格式，标注文件采用xml格式，各字段含义参照voc数据集。VOC各字段含义对应表为：

├── filename 文件名

├── size 图像尺寸

├── width 图像宽度

├── height 图像高度

└──depth 图像深度，一般为3表示是彩色图像

└── object图像中的目标，可能有多个

├── name 该目标的标签名称

└── bndbox该目标的标注框

├── xmin 该目标的左上角宽度方向坐标

├── ymin 该目标的左上角高度方向坐标

因赛AIGC

因赛AIGC解决营销全链路应用场景

查看详情

├── xmax 该目标的右下角宽度方向坐标

└── ymax 该目标的右下角高度方向坐标

四、比赛思路

该赛题很明显是实现目标检测，所以使用PaddleDetection是最方便的，数据集是VOC格式，也不需要进行格式转换。将数据集划分训练集和验证集，然后用PaddleDetection直接训练就可以了。

PaddleDetection文档可见：欢迎使用 PaddleDetection!

PaddleDetection官方源码：PaddleDetection

In [ ]

#首先以8：2划分一下训练集和验证集import osimport random

Root='iFLYTEK_Xray/train'with open('train.txt','w',encoding='utf-8') as fw:    for path in os.listdir(Root):
        path=os.path.join(Root,path)
        files=os.listdir(path)        for file in files:            if file.endswith('.jpg'):
                fw.write(os.path.join(path,file)+' '+ os.path.join(path,'XML/'+os.path.basename(file).split('.')[0]+'.xml\n'))with open('train.txt','r',encoding='utf-8') as fr:
    lines= fr.readlines()
    random.shuffle(lines)with open('train.txt','w',encoding='utf-8') as fw:
    fw.writelines(lines[:int(len(lines)*0.8)])with open('eval.txt','w',encoding='utf-8') as fw:
    fw.writelines(lines[int(len(lines)*0.8):])

登录后复制

五、使用HRNet进行训练

Paper：Deep High-Resolution Representation Learning for Human Pose Estimation

iFLYTEK：X光安检图像识别2021挑战赛 - php中文网

HRNet从一个高分辨率子网作为第一级开始，逐步将高分辨率子网和低分辨率子网逐一相加，形成多个级，并将多分辨率子网连接起来同时进行，使网络在整个过程中保持高分辨率的表示。因此，预测的关键点热图可能更精确，空间上更精确。

iFLYTEK：X光安检图像识别2021挑战赛 - php中文网

（1）对配置文件进行修改

主要修改：configs/datasets/voc.yml、configs/hrnet/faster_rcnn_hrnetv2p_w18_1x_coco.yml、configs/hrnet/_base_/faster_rcnn_hrnetv2p_w18.yml、configs/faster_rcnn/_base_/optimizer_1x.yml以及configs/faster_rcnn/_base_/faster_fpn_reader.yml

这里仅仅将图片Resize到[640, 640]

（2）模型训练

六、模型预测

模型预测代码主要针对比赛作品提交要求进行了修改，修改代码主要为：tools\infer.py、ppdet\utils\visualizer.py。

（1）生成图片预测文本

这里要注意，由于赛题提交的json文件没有图片名，只是一串数组，所以预测图片必须要按照从小到大的顺序进行排列。

iFLYTEK：X光安检图像识别2021挑战赛 - php中文网

In [ ]

import os

Root='iFLYTEK_Xray/test'file_list = sorted(os.listdir(Root),key=lambda x:os.path.basename(x).split('.')[0])with open('test.txt','w',encoding='utf-8') as fp:    for path in file_list:
        fp.write(os.path.join(Root,path)+'\n')

登录后复制

（2）对图片进行预测

预测配置可见：训练/评估/预测

In [ ]

!python PaddleDetection/tools/infer.py \
                -c PaddleDetection/configs/hrnet/faster_rcnn_hrnetv2p_w18_2x_coco.yml \
                --output_dir=infer_output/ \
                --draw_threshold=0.5 \
                -o weights=output/faster_rcnn_hrnetv2p_w18_1x_coco/best_model

登录后复制