一、赛题背景
铁素体-珠光体钢(低碳钢)因强韧兼备的优异特性,占工业用钢总量40%以上,广泛应用于汽车制造、机械装备、建筑工程等关键领域。晶粒度与晶粒形貌是决定该类钢材力学性能的核心微观参数,其大小、均匀性与边界完整性直接影响材料的强度、韧性及抗疲劳性,晶粒异常、混叠、边界模糊易导致核心零部件在服役过程中失效,引发安全风险。
在工业生产与检测场景中,晶粒度检测面临双重核心难题:一方面,传统检测依赖人工依据GB/T6394-2017、ASTME112等标准评级,不仅对检测人员的经验要求极高,且低碳组织中珠光体片层、铁素体晶界、多晶粒粘连交互复杂,主观误差达±0.5级以上,解译效率低下;另一方面,工业环境下金相样本制备成本高、周期长,实例级标注需专业人员逐晶粒勾勒,使得高质量标注数据获取难度大、成本高昂,难以满足大规模检测需求。学术与技术层面,无监督、小样本学习虽为突破数据瓶颈的关键方向,但现有算法在低碳钢多晶粒实例区分、晶界精准提取、粘连晶粒分割等方面仍存在技术短板,难以适配工业实际场景。
二、赛题应用场景
随着机器视觉与深度学习技术在材料微观表征领域的深度渗透,如何在工业数据获取难、标注成本高的现实约束下,基于无监督、小样本技术从珠光体+铁素体组织的金相图像中精准高效提取晶粒度信息,成为突破传统检测局限的关键。本次竞赛聚焦低碳钢晶粒度智能检测的核心需求,提供贴合工业实际的小样本金相图像数据集,旨在吸引材料科学、计算机视觉等领域的研究人员与技术爱好者参与,促进学术界与工业界的技术交流合作,推动晶粒度检测向低数据依赖、自动化、精准化升级,进而加速智能检测技术在钢铁生产、机械制造、汽车工业等关键领域的落地应用,为材料质量控制与工艺优化提供核心技术支撑。
三、赛题任务
核心任务:基于赛方提供的500张无标签低碳钢金相图像,开发无监督或半监督实例分割算法(半监督算法可自主标注部分训练数据,标注总量不超过无标签数据的50%,即≤250张),实现铁素体晶粒、珠光体区域的像素级实例分割,区分每一个独立铁素体晶粒与每一个独立珠光体团簇,并输出实例索引掩码图+实例类别对应文件,用于计算实例分割mIoU。
具体范围界定:
- 执行类别感知的实例分割:
每个独立铁素体晶粒为一个实例;
每个独立珠光体团簇/区域为一个实例;
- 输出必须包含:每个像素属于哪个实例+每个实例属于哪个类别;
- 训练数据仅限官方500张无标签数据;
- 输出格式严格匹配尺寸、坐标、命名规范。
四、数据集及数据说明
(一)数据来源
数据来源于真实工业场景下的低碳钢试样,经标准磨抛、腐蚀工艺处理后,通过高倍显微镜(500倍)拍摄获取,涵盖不同生产批次、腐蚀工艺的典型样本,具有广泛的工业代表性。
(二)相区定义及图像特征(标注参考)
- 铁素体晶粒(FerriteGrain)
类别:1
定义:碳在αFe中的间隙固溶体,低碳钢主要软相组织;单个铁素体晶粒为独立实例。
图像特征:在金相图像中呈亮白色/浅灰色,区域内部灰度均匀,无明显纹理结构,边界多为平滑曲线(晶界),单个晶粒尺寸通常在5-20μm之间。
- 珠光体区域(PearliteRegion)
类别:0
定义:铁素体与渗碳体层片状共析组织,低碳钢主要硬相组织;连续珠光体团簇为独立实例。
图像特征:在金相图像中呈深灰色/黑色,具有明显的片层状纹理(放大后可见交替排列的明暗条纹),常以块状或带状分布,与铁素体区域形成显著灰度对比。
(三)精简标注说明
- 标注工具:推荐使用LabelMe、VGGImageAnnotator(VIA)等开源标注工具,支持像素级实例掩码标注与类别标记;
- 标注原则:
优先区分铁素体晶粒与珠光体区域核心类别,边缘模糊区域依据灰度/纹理判定(无片层纹理归为铁素体);
每个独立铁素体晶粒单独标注为一个实例,每个连续珠光体团簇单独标注为一个实例;
粘连晶粒沿晶界趋势拆分,极小杂质点忽略并归为相邻实例;
- 标签赋值:
(1)例索引掩码:像素值为1~255,每个实例赋予唯一编号,0为背景/忽略;
(2)实例类别:铁素体晶粒=1、珠光体=0,与实例编号一一对应;
(3)输出格式:实例索引掩码图(inst.png)+实例类别JSON文件,无多余数值干扰。
(四)数据规模
无标签训练集包含500张图像,用于模型的无监督/半监督训练,数据中涵盖相区粘连、杂质干扰等真实工业场景;初赛测试集包含68张图像,用于模型性能的初步评估,赛方提供真实标签用于机器自动评分;复赛测试集包含100张图像,用于模型性能的进阶评估,同样提供真实标签用于评分;半决赛测试集包含150张图像,用于最终性能评测,其中包含弱腐蚀、晶粒异常等复杂工况样本;此外提供1张示例图像,用于展示数据格式与相区参考(标注铁素体与珠光体区域)。
(五)数据格式及示例
- 输入图像:JPG格式,包含两种常见分辨率(1244×1044像素、2448×2048像素),3通道(像素值范围0-255),示例文件名:“train_001.jpg”“test_001.jpg”;
- 分割标签/提交结果格式(PNG掩码图):
(1)格式要求:
实例索引掩码图:8位单通道PNG图像,分辨率与对应输入图像完全一致(需匹配输入图的1244×1044或2448×2048像素),像素值为0~255,其中0表示背景/忽略,1~255表示不同实例编号,每个独立铁素体晶粒、独立珠光体团簇均为唯一实例编号;
实例类别对应文件:JSON格式,与图像同名,记录每个实例编号对应的类别,0=珠光体,1=铁素体晶粒。
(2)命名规则:
实例索引掩码:输入图test_001.jpg→输出test_001_inst.png
实例类别文件:输入图test_001.jpg→输出test_001_class.json
(3)示例说明(以局部区域为例):
输入图像中坐标(100,200)至(150,250)的亮白色均匀铁素体晶粒→实例掩码对应区域像素值=1,JSON中”1″:1;
输入图像中坐标(160,210)至(200,260)的另一独立铁素体晶粒→实例掩码对应区域像素值=2,JSON中”2″:1;
输入图像中坐标(300,400)至(350,450)的深灰色片层珠光体团簇→实例掩码对应区域像素值=3,JSON中”3″:0。
验证方式:用Python的PIL库读取实例掩码后,需满足mask.dtype==’uint8’且mask.shape==输入图.shape;实例编号范围为0~255,JSON文件中包含所有非0实例编号,且类别仅允许为0或1,否则视为无效提交。
(六)数据组织
训练集与测试集均按文件夹分类存储,文件夹结构示例:
数据集根目录/
├─train_images/#无标签训练集图像(JPG格式)
│├─train_001.jpg
│├─train_002.jpg
│└─…
├─test_images/#测试集图像(初赛/复赛/半决赛,JPG格式)
│├─test_001.jpg
│├─test_002.jpg
│└─…
└─example/#示例图像及标注参考
├─example_image.jpg
└─example_results.png
(七)数据特点
包含多种干扰场景:相区粘连、腐蚀不均、微小杂质、晶界模糊等;
铁素体与珠光体灰度差异存在波动(受腐蚀工艺影响),部分样本灰度重叠度较高;
无标签数据无类别偏倚,覆盖低碳钢典型组织比例(铁素体占比6%-90%);
图像分辨率包含1244×1044、2448×2048两种,需模型适配不同尺寸输入。
五、算法设计要求
(一)模型类型
- 核心要求:以无监督分割算法为基础,允许采用半监督学习(仅使用自主标注的训练数据,标注总量≤250张);
- 禁止使用全监督预训练模型(如基于其他金相图像数据集预训练的模型),仅允许使用通用图像分割模型的无监督初始化(如SAM模型的无监督特征提取,禁止使用预训练的相区分割权重);
- 推荐算法方向:无监督聚类(如K-Means改进)、自监督特征学习(如对比学习)、生成式模型(如VAE、扩散模型)、传统图像分割(如阈值分割、区域生长)的改进方案等。
(二)创新性
- 鼓励提出针对材料微观图像的无监督分割创新架构,如融合金相学先验知识(如相区灰度分布特性、晶界连续性)的算法;
- 鼓励改进现有无监督算法的鲁棒性,适配工业场景中的灰度波动、杂质干扰等问题;
- 主动学习策略的创新性(如数据筛选逻辑、标注效率提升方法)将作为主观评分的重要依据。
(三)可扩展性
- 算法应具备良好的跨设备兼容性;
- 模型需适配两种输入分辨率(1244×1044、2448×2048像素),分割性能无显著下降;
- 算法应具备低资源消耗特性,模型参数量不超过500M。
(四)数据使用限制
- 仅允许使用赛方提供的500张无标签训练集及自主标注的训练数据,且自主标注数据总量不得超过无标签训练数据的50%(即≤250张);
- 严禁使用其他公开/私有金相图像数据集、外部标签或测试集标注信息;
- 禁止对测试集数据进行人工标注或修改,严禁通过任何方式获取测试集真实标签;
- 组委会将对代码及标注数据使用情况进行复现验证,若发现违规使用数据,取消参赛资格。
六、性能指标要求
本次竞赛采用交并比(IoU)和平均交并比(mIoU)作为核心评价指标,具体定义:
- 实例分割mIoU(占总分50%)
(1)实例匹配规则
- 仅对类别相同的实例进行匹配;
- 一个真实实例最多匹配一个预测实例,一个预测实例最多匹配一个真实实例;
- 匹配依据:IoU最大;
只有匹配IoU≥0.5的配对,才视为有效匹配。
(2)实例IoU计算
对一组有效匹配的真实实例与预测实例,实例IoU定义为:

P:预测实例的像素区域
G:真实实例的像素区域
∩:交集(同时属于预测与真实的像素数)
∪:并集(属于预测或真实的像素数)
IoU_inst:单个实例的分割精度
(3)实例mIoU计算公式

N:有效匹配的实例对总数
IoU_inst(i):第i个有效实例对的实例IoU
mIoU_inst:所有有效实例的平均交并比,为实例分割核心指标
(4)mIoU得分(满分50分)

- 晶粒度面积法得分(占总分50%)
参考GB/T63942017平均晶粒度面积法,做竞赛化简化计算:
(1)平均晶粒面积

M:真实铁素体晶粒数量
K:预测铁素体晶粒数量
A_gt(j):第j个真实铁素体晶粒的像素面积
A_pred(k):第k个预测铁素体晶粒的像素面积

(满分100分,两指标各占50%)
七、功能要求
(一)准确性
对灰度波动、杂质干扰等复杂场景也能准确识别,避免严重漏分割或误分割。
(二)可靠性
算法在不同批次、不同腐蚀工艺、不同分辨率的测试样本上性能稳定。
(三)鲁棒性
算法需抵御图像噪声、光照变化等干扰,分割结果不受轻微图像预处理(如灰度归一化、平滑滤波)的影响;
禁止过度依赖特定图像特征(如固定灰度阈值),需适配不同拍摄参数、不同分辨率下的样本。
(四)无监督兼容性
纯无监督方案需完全不依赖人工标注数据,仅通过无标签数据实现相区分割;
半监督方案需明确标注数据的使用比例及作用(如仅用于微调、特征校准等),标注数据量需符合≤250张的限制。
八、开发环境
(一)编程语言
推荐使用Python3.6及以上版本,需兼容主流数据处理与深度学习库。
(二)框架与工具
允许使用开源框架:PyTorch、TensorFlow、Scikit-learn、OpenCV等;
允许使用通用无监督分割工具(如SAM、CLIP等)进行特征提取,但禁止使用预训练的相区分割模型;
禁止使用商业闭源软件(如MATLAB的专有分割工具箱)或封装式API直接输出分割结果。
(三)硬件环境
开发阶段:无强制要求,可使用本地工作站或云端服务器;
测试阶段:代码复现将在标准环境中运行,确保公平性。
(四)依赖库
需提供完整的依赖库清单(requirements.txt),明确版本号,避免兼容性问题。
九、成绩评价
(一)评分构成
初赛和复赛采用机器自动评分(以实例分割综合得分为核心指标),该成绩不计入决赛总分;半决赛采用机器自动评分(以实例分割综合得分为核心指标),成绩占总决赛总分的70%(客观分);总决赛采用主观评分(基于答辩表现),成绩占总决赛总分的30%(主观分),包含算法创新性、工程性等评价维度。
(二)评分细则
- 客观评分(满分70分):客观分为实例分割综合得分按比例折算,综合得分由实例mIoU(50%)与晶粒度面积法得分(50%)加权组成。实例mIoU得分=实例mIoU×50;晶粒度面积法得分=max(0,1−面积相对误差)×50;实例分割综合得分=实例mIoU得分+晶粒度面积法得分(满分100分);客观分=实例分割综合得分×0.7(满分70分)。
- 主观评分(30分):算法创新性占10分(评价无监督实例分割、晶粒解缠、主动学习策略的创新程度);工程落地性占10分(评价算法效率、分辨率适配能力、粘连/弱腐蚀样本鲁棒性);技术报告质量占5分(评价方案阐述、实验分析、结果可视化);答辩表现占5分(评价问题响应、技术细节解释)。
- 加分项:纯无监督方案(未使用任何自主标注数据)且实例分割综合得分≥70分,额外加5分(加分后总分不超过100分)。
十、解题思路
(一)知识点(含主动学习相关)
- 无监督分割核心知识点
(1)无监督聚类算法(K-Means、谱聚类):考查基于灰度/特征的聚类优化能力,重点在于应对灰度波动场景的鲁棒性设计;
(2)自监督特征学习(对比学习、掩码自编码):考查从无标签数据中提取判别性特征的能力,需结合金相图像的结构特性;
(3)传统图像分割(阈值分割、区域生长、形态学操作):考查基础分割算法的改进与融合能力,重点在于边缘优化与噪声抑制。
- 主动学习相关知识点:
(1)数据筛选策略(不确定性采样、核心集选择、多样性采样):考查高价值数据的识别逻辑,需结合分割任务的误差分布特点;
(2)半监督学习融合(伪标签生成、一致性正则化):考查少量标注数据的高效利用能力,重点在于减少标注偏差的影响;
(3)标注流程设计:考查标注效率与模型性能的平衡能力,需明确标注数据的迭代使用逻辑(标注总量≤250张)。
- 工程实现知识点:
(1)图像预处理(灰度归一化、噪声过滤、增强):考查适配工业图像质量差异的处理能力;
(2)分辨率适配技术(如自适应缩放、多尺度特征提取):考查模型对不同尺寸输入的兼容能力;
(3)模型轻量化与效率优化:考查在有限硬件资源下的性能与速度平衡能力(针对2448×2048高分辨率图像)。
(二)思路引导(含主动学习方案)
- 纯无监督思路:
先通过图像预处理(如直方图均衡化、高斯滤波)统一数据分布,减少腐蚀工艺差异带来的影响;
针对不同分辨率图像,可采用自适应缩放至统一尺寸处理(需注意保持相区比例),或设计多尺度特征提取模块适配原始尺寸;
基于自监督学习模型(如MoCo、SimSiam)提取图像特征,再利用聚类算法(如改进K-Means加入空间约束)实现相区划分;
结合形态学操作(膨胀、腐蚀、边界平滑)优化分割结果,修正相区粘连与边缘模糊问题。
- 主动学习+半监督思路:
初始化:用无监督算法(如传统分割+聚类)得到初始模型,对无标签数据(涵盖两种分辨率)进行预测;
数据筛选:基于预测不确定性(如熵值、置信度)或特征多样性,筛选高价值数据进行自主标注(累计≤500张,建议两种分辨率数据均有覆盖);
迭代优化:用标注数据训练半监督模型(如伪标签辅助、一致性正则化),再用新模型重新筛选高价值数据,迭代提升性能;
标注策略:可采用“小批量多次标注”(如每次50张),避免一次性标注过多低价值数据,确保标注效率。
- 关键方向提示:
可融合金相学先验知识(如铁素体灰度范围、珠光体片层纹理特征)约束分割逻辑;
针对高分辨率图像(2448×2048),可采用分块处理或轻量化网络架构,平衡分割精度与速度;
针对复杂样本(弱腐蚀、晶界模糊),可设计多尺度特征融合或注意力机制提升鲁棒性。
(三)注意事项
- 数据处理注意事项
避免过度预处理导致特征丢失(如强平滑可能模糊珠光体片层纹理);
处理不同分辨率图像时,需保持相区位置与比例一致性,避免缩放导致的边缘错位;
标注数据需严格遵循“铁素体=1、珠光体=0”的规则,且总量不超过250张,避免违规使用标注数据。
- 算法实现注意事项
纯无监督方案需避免隐性依赖标注信息(如手动设置固定阈值本质为人工标注);
主动学习需记录完整的标注筛选逻辑与迭代过程,便于组委会复现验证;
模型需同时适配1244×1044和2448×2048分辨率,建议在训练中涵盖两种尺寸数据,提升泛化能力;
压缩包需按要求命名且无嵌套文件夹,否则可能导致评测系统无法读取;
提交代码需包含完整的训练与推理流程,明确分辨率适配方案,未提供可复现代码将影响成绩评定。
十一、赛题约束条件
(一)算法约束
核心技术限定:以无监督分割算法为基础,允许采用半监督学习(需结合自主标注数据),但禁止使用基于其他金相图像数据集的全监督预训练模型;仅允许使用通用图像分割模型的无监督初始化(如SAM模型的无监督特征提取),禁止使用预训练的相区分割权重。
工具使用限制:允许使用开源框架(PyTorch、TensorFlow、Scikit-learn、OpenCV等)及开源工具(如LabelMe、VGGImageAnnotator),禁止使用商业闭源软件(如MATLAB的专有分割工具箱)或封装式API直接输出分割结果。
性能与效率约束:模型参数量不超过500M;训练时间不超过72小时(普通工作站CPU+单GPU环境);需适配1244×1044、2448×2048两种分辨率输入,分割性能无显著下降。
(二)数据使用约束
数据来源限定:仅允许使用赛方提供的500张无标签训练集图像及自主标注的训练数据,严禁使用其他公开/私有金相图像数据集、外部标签或测试集标注信息。
自主标注限制:半监督学习中自主标注的训练数据总量不得超过无标签训练数据的50%(即≤250张),需明确标注筛选逻辑与使用方式,便于组委会复现验证。
测试集使用规范:禁止对测试集数据进行人工标注、修改或通过任何方式获取真实标签;严禁将测试集数据用于训练过程。
数据保密要求:赛事提供的所有数据集(训练集、测试集、示例图像)仅可用于本次赛事相关研究与参赛,禁止泄露、传播或用于非赛事相关的商业用途,违反者取消参赛资格。
十二、参考资源
(一)学术文献
《UnsupervisedImageSegmentationwithDeepLearning:ASurvey》
《ContrastiveLearningforUnsupervisedSegmentationofMedicalImages》
《主动学习在图像分割中的应用研究》
《金相图像分析中的无监督分割方法综述》
《多尺度特征融合在高分辨率图像分割中的应用》
(二)开源工具
SAM(SegmentAnythingModel):无监督特征提取;
Scikit-image:传统图像分割算法(阈值分割、区域生长);
PyTorch-Spectral-Clustering:谱聚类实现;
DeepLab系列:无监督/半监督分割框架;
LabelMe:开源像素级标注工具;
VGGImageAnnotator(VIA):轻量级开源标注工具。
(三)行业标准
GB/T6394-2017《金属平均晶粒度测定方法》
ASTME112《StandardTestMethodsforDeterminingAverageGrainSize》
十三、提交要求
(一)初赛和复赛提交内容
- 实例分割结果文件:测试集的实例索引掩码图(.png)+实例类别文件(.json),按以下规则命名:
实例掩码:test_001_inst.png
类别文件:test_001_class.json
压缩为:初赛(复赛)结果_团队名.zip(压缩包内无嵌套文件夹)
- 技术摘要:PDF格式(≤2页),简述算法思路、核心逻辑;
- 提交限制:每天最多提交 5 次,排行榜实时更新,以最后一次提交为准。
(二)半决赛、决赛提交内容
- 分割结果文件:测试集的分割掩码图(PNG格式),命名规则同初赛;
- 技术报告:PDF格式(≥1000字),详述算法架构、创新点、实验结果、标注数据使用情况(含筛选逻辑、标注数量、使用方式);
- 模型文件:训练好的模型权重(格式不限,需支持复现);
- 完整代码:含数据预处理、模型训练、推理脚本,需提供详细注释及运行说明(README.md);
- 技术报告升级版:补充半决赛测试集实验分析,算法创新等等;
- 答辩PPT:≤10页,提炼核心技术与成果。
- 作品海报:尺寸为A1(841mmx594mm),电子版分辨率为300dpi,文件统一保存为PNG格式。
十四、奖金设置
为了鼓励参赛选手参赛积极性,激发在复杂制造场景下的技术创新潜能,本赛题不仅设立了丰厚的现金奖励,更针对优秀的青年算法人才开辟了专属的职业发展绿色通道。具体激励设置如下:
(一)赛事奖金设置
本赛题将根据总决赛的最终综合成绩(含线上客观评测与线下答辩),对全国总决赛一等奖前六名参赛团队按照如下标准颁发奖金:
- 冠军奖:第1名,奖金8000元/每团队
- 亚军奖:第2-3名,奖金6500元/每团队
- 季军奖:第4-6名,奖金3000元/每团队
(二)人才招募专属特权
为加速“人工智能+”创新成果向新质生产力的转化,切实打通产学研用链路,针对在本赛题中展现出卓越代码能力与工程落地思维的优秀参赛选手(不限于前六名获奖团队成员),出题方还将额外提供以下极具含金量的职业发展激励:
- 核心岗位面试直通卡:
在复赛或总决赛中表现突出的核心算法选手,将获得人工智能研究院算法研发岗位的“校招面试直通卡”。凭此卡可直接免除在线笔试与简历初筛环节,直通终审技术面,优先锁定高潜算法人才核心席位。
- 专项精英实习计划:
定向开放工业计算机视觉、大模型前沿应用等核心研发方向的优质实习岗位。受邀实习生将直接参与真实的高级别产线视觉项目,享有充足的算力资源支持与资深算法研究员的1v1业务指导,积累宝贵的工业界实战经验,实习期间表现优异者可获全职Offer提前转正机会。
十五、其他说明
(一)公平性
严禁任何形式的作弊行为,包括但不限于使用测试集标签、抄袭他人代码、共享标注数据;
组委会将通过代码复现、IP溯源等方式核查作弊行为,一经发现立即取消参赛资格。
(二)知识产权
参赛作品需为原创,未在其他比赛中获奖或公开发表;
参赛团队拥有作品的知识产权,组委会有权对作品进行展示、宣传;
优胜算法可与组委会协商进行产业化转化,相关权益另行约定。
(三)更新与答疑
赛题相关更新(含最终确认的图像分辨率)将通过官网、QQ群发布,参赛团队需持续关注;
技术疑问可通过赛题交流QQ群提交,组委会将在2个工作日内回复。
十七、联系方式
赛题交流QQ群:1092664543
邮箱:caitao@njsteel.com.cn
报名官网:www.aicomp.cn
赛题规则:低碳钢金相图像无监督相区分割

2025精彩瞬间
大赛回顾
关注我们