一、赛题背景
高炉是钢铁生产中将铁矿石炼成铁水的核心设备。生产过程中,高炉会周期性出铁。一次从开口放铁到本次堵口结束的完整过程,称为一个“铁次”。本赛题中的“出铁量”是指该铁次最终产出的铁水总量,单位为吨;“出铁时长”是指该铁次从开铁到堵口完成所经历的总时间,单位为分钟。
在实际生产中,调度人员需要在一个铁次开始时,提前判断本次大约能出多少铁、会持续多久,以便安排铁水罐、运输和炼钢接铁计划。如果判断偏差较大,就可能出现准备不足、等待时间增加或资源占用不合理等问题。
因此,本赛题要解决的问题可以简单理解为:给定某钢铁企业高炉在目标铁次开始前已经能够看到的历史数据,建立模型预测该铁次最终会产出多少铁水,以及这次出铁会持续多长时间。赛题重点考察数据理解、时间对齐、特征构造和回归预测能力。
二、赛题应用场景
本赛题的应用场景是钢铁企业的高炉出铁调度。每当一个新铁次即将开始时,现场都需要提前准备好接铁和运输资源。如果能够提前判断该铁次的出铁量和持续时间,就能更合理地安排铁水罐、运输和炼钢接收计划;如果判断不准,就可能出现等待、拥堵或准备不足。
本赛题聚焦单铁次预测场景。参赛者需要在目标铁次开铁时,基于此前已经积累的历史数据,预测该铁次结束后的两个结果,即总出铁量和总出铁时长。该任务可以作为后续生产组织、运输调度和计划优化的基础模块。
三、赛题任务
参赛者需要利用主办方提供的高炉历史生产数据,建立单铁次预测模型。在每个待预测样本中,只能使用该样本预测参考时刻及之前已经产生的数据,预测目标铁次最终的出铁量和出铁时长。
(一)任务描述
本赛题的核心任务是:针对样本主表中给出的每一个目标铁次,基于官方提供的样本索引表、历史出铁实绩、小时级炉况过程数据和事件级变料/质量数据,自主完成数据清洗、时序对齐、特征构造、模型训练和结果推理。训练样本时间范围为2024年3月1日至2024年11月30日;初赛测试样本时间范围为2024年12月1日至2024年12月31日;复赛测试样本时间范围为2025年1月1日至2025年1月31日;半决赛测试样本时间范围为2025年2月1日至2025年3月26日。
(二)任务输入输出说明
- 输入数据:训练/测试样本主表(train_samples.csv、test_a_samples.csv、test_b_samples.csv、test_c_samples.csv),以及与之配套的小时级炉况过程表(operation_hourly.csv)、事件级变料/质量表(burden_change.csv)和训练期历史出铁实绩表(tap_history_train.csv)。
- 输入时间与约束:官方提供的全部样本时间范围覆盖2024年3月1日至2025年3月26日。样本主表中的预测参考时刻统一为目标铁次的开铁时间。对任一训练样本或测试样本进行预测时,仅允许使用该参考时刻及其之前的数据,禁止使用本铁次后续过程信息和任何未来信息。
- 输出结果:对每个目标铁次输出两个连续值,分别为该铁次结束后的总出铁量预测值(单位:吨)和该铁次从开铁到堵口完成的总时长预测值(单位:分钟)。
- 任务属性:这是一个面向真实工业场景的多表时序回归任务,既需要完成多源数据的时间对齐,也需要对两个连续目标进行联合预测或分别预测。
四、数据集及数据说明
(一)数据来源
数据来源于某钢铁企业某大型高炉连续生产过程中的真实业务记录,主要包括三类数据:出铁实绩数据、小时级炉况过程数据和事件级变料/质量数据。原始数据经主办方进行匿名化、脱敏、字段标准化和格式转换后,以赛事专用数据包形式提供。
(二)数据规模
本赛题所有样本时间范围覆盖2024年3月1日至2025年3月26日。原始小时级炉况数据约9360条,事件级变料记录约4021条,出铁实绩明细约22004条。由于同一铁次可能对应多条铁罐明细记录,官方将其按铁次主键进行聚合,最终形成约3959个铁次级样本。
本赛题采用时间顺序切分方式组织数据,以贴近工业场景中的实际部署方式并避免时间穿越。训练集时间范围为2024年3月1日至2024年11月30日,共约2754个标注样本;初赛测试集时间范围为2024年12月1日至2024年12月31日,共约335个样本;复赛测试集时间范围为2025年1月1日至2025年1月31日,共约322个样本;半决赛测试集时间范围为2025年2月1日至2025年3月26日,共约548个样本。官方仅提供训练集标签,测试集不提供标签,参赛者可在训练集内部自行划分验证集。
(三)数据文件说明
- train_samples.csv(铁次级):训练样本主表,包含样本编号、铁次号、铁口号、预测参考时刻、出铁量标签、出铁时长标签等字段;
- test_a_samples.csv(铁次级):初赛测试样本主表,包含样本编号、铁次号、铁口号、预测参考时刻等字段,不含标签;
- test_b_samples.csv(铁次级):复赛测试样本主表,字段与初赛测试样本一致,不含标签;
- test_c_samples.csv(铁次级):半决赛测试样本主表,字段与初赛测试样本和复赛测试样本一致,不含标签;
- operation_hourly.csv(小时级):高炉小时级过程数据,包含入炉风量、冷风压力、热风压力、富氧、热风温度、喷煤量、湿度、煤气利用率、炉顶压力、差压、风压比、炉顶温度平均、实际风速、炉喉温度等字段;
- burden_change.csv(事件级):高炉变料与质量数据,包含铁量、综合品位、矿耗、燃料比、焦比等事件级特征字段;
- tap_history_train.csv(铁次级):由出铁实绩明细聚合得到的训练期历史铁次实绩表,包含参考时刻、堵口时间、实际出铁量、出铁时长、受铁罐数等字段;
- data_dictionary.xlsx(说明文件):字段释义、单位说明、空值含义、时间字段口径及使用注意事项。
除data_dictionary.xlsx外,其余赛事数据均采用CSV格式发布,统一使用UTF-8编码;时间字段统一采用北京时间(UTC+8),数值字段保留原始工程单位。训练样本主表、测试样本主表和历史铁次实绩表中的参考时刻均对应目标铁次的开铁时间。参赛者需要利用该时刻及之前的数据,预测该铁次结束后的总出铁量和总出铁时长。对于少量缺失值,赛事方不进行统一插补,由参赛者自行设计处理方案。
(四)数据预处理说明
- 对涉企字段、设备编码、罐号等敏感信息进行匿名化和脱敏处理;
- 对异常时间戳、重复表头行等明显格式问题进行基础清洗;
- 对出铁实绩明细按铁次主键进行聚合,保留总出铁量和总出铁时长作为训练标签;
- 官方仅完成基础格式处理,不提供最终建模特征,参赛者需自行完成多表时序对齐和特征构建。
五、算法设计要求
(一)模型类型
本赛题对算法类型不做严格限定,鼓励参赛者采用适用于工业结构化时序数据的机器学习或深度学习方法,包括但不限于XGBoost、LightGBM、CatBoost、随机森林、TabNet、多层感知机、Transformer、多任务学习模型及集成学习方案。
(二)创新性
鼓励参赛者围绕多表时序对齐、工业机理先验注入、异常样本鲁棒处理、多目标协同建模、结果校准和可解释性分析等方向形成创新方案。
(三)可扩展性
算法方案应具备良好的可扩展性,能够在不同配置的CPU/GPU环境中运行,并在样本规模增加、字段扩展或工况变化时保持相对稳定的性能表现。
(四)工程可落地性
算法方案应兼顾预测精度与工程可落地性,避免依赖不可复现的复杂人工规则或不可离线运行的外部服务。进入总决赛的方案需支持在统一环境下完整复现。
六、性能指标要求
(一)主要指标
- 出铁量加权绝对百分比误差:WMAPE_iron=Σ|预测出铁量-实际出铁量|/Σ实际出铁量。
- 出铁时长加权绝对百分比误差:WMAPE_time=Σ|预测出铁时长-实际出铁时长|/Σ实际出铁时长。
- 综合机器评分:Score_main=100×[1-0.5×WMAPE_iron-0.5×WMAPE_time],最低记为0分,分值越高越优。
(二)次要指标
- 出铁量平均绝对误差,用于辅助评估吨位偏差。
- 出铁时长平均绝对误差,用于辅助评估节拍偏差。
- 模型文件大小和全量测试推理时长,用于总决赛工程评价。
(三)目标参考
高质量方案应在隐藏测试集上稳定优于官方基准线方案,并在出铁量误差控制、出铁时长误差控制和综合机器评分等方面达到较优水平。
七、功能要求
(一)准确性
算法应能够为每个测试样本输出完整、数值合理的出铁量和出铁时长预测结果,并尽量降低大偏差样本的比例。
(二)可靠性
面对不同月份、不同料制、不同风氧制度和不同生产节奏区间的样本,算法应保持稳定输出,不应因局部工况变化而出现成批失真。
(三)鲁棒性
算法应对缺失值、重复值、异常值、统计口径差异和明细级多行聚合问题具备较强鲁棒性。
(四)时效性
在统一测评环境中,算法应在规定时间内完成全量测试样本推理。原则上,单样本平均推理耗时不超过1秒,全量阶段测试集推理时长不超过30分钟;正式阈值以赛事发布稿和测评细则为准。
(五)可解释性
鼓励参赛者提供特征重要性分析、样本级误差分析或关键影响因素可视化结果,以增强方案的可解释性。
(六)功能测试方式
赛事方将在统一离线环境中测试算法是否能够正确读取数据、按要求生成结果文件,并检查结果完整性、字段合法性、样本覆盖率、运行时长和可复现性。
八、开发环境
(一)软件环境
- 操作系统:Linux(推荐Ubuntu20.04/22.04)或Windows10/11。
- 编程语言:Python3.10及以上版本。
- 推荐依赖:NumPy、Pandas、SciPy、scikit-learn、XGBoost、LightGBM、CatBoost、PyTorch、Matplotlib、Seaborn。
- 工程文件:应提供requirements.txt、README.md、运行脚本等辅助文件。
(二)硬件环境
- CPU环境:8核及以上CPU,32GB及以上内存。
- GPU环境:非强制要求;若采用深度学习方案,建议单卡显存16GB及以上。
- 存储空间:建议可用磁盘空间50GB及以上。
九、成绩评价
(一)指标权重
机器评分阶段,出铁量指标权重为50%,出铁时长指标权重为50%。排行榜及阶段晋级统一以综合机器评分为主排序指标。
(二)评分细则
- 初赛阶段:依据初赛测试集综合机器评分进行排序,用于开发验证和复赛晋级选拔。
- 复赛阶段:依据复赛测试集综合机器评分进行排序,用于半决赛晋级选拔。
- 半决赛阶段:依据半决赛测试集综合机器评分进行排序,并作为总决赛客观评分基础。
- 若综合机器评分相同,则依次比较出铁量加权绝对百分比误差、出铁时长加权绝对百分比误差;若仍相同,则以较早提交时间为先。
5.有效成绩阈值设定为:综合机器评分不低于60分,且不低于官方基线参考分数。
(三)其他评分因素
总决赛采用“70%客观评分+30%主观评分”的评价方式。其中客观评分为半决赛机器测评得分标准化结果,主观评分由专家组结合技术创新性、工业可落地性、结果复现性、技术文档质量和答辩表现综合给出。
- 客观评分(机器测评)(权重:70%):以半决赛隐藏测试集综合机器评分标准化结果计入。
- 技术创新性(权重:10%):主要考察特征设计、模型方法和问题解决思路。
- 工程复现性(权重:10%):主要考察代码运行、结果复现、效率和提交规范性。
- 技术文档与答辩质量(权重:10%):主要考察文档完整性、表达逻辑、分析深度和答辩表现。
十、解题思路
(一)知识点
本赛题主要考核工业多表数据理解、时间序列对齐、特征工程、回归建模、多目标优化、异常处理、时间切分验证、结果解释与工程复现等能力。
(二)思路引导
- 明确铁次级标签口径,处理好出铁实绩明细中“同一铁次多行铁罐记录”的聚合问题。
- 围绕样本参考时刻完成小时级炉况数据和事件级变料数据的时序对齐。
- 重点关注入炉风量、风压、富氧、热风温度、喷煤量、湿度、煤气利用率、差压、风压比、炉顶温度、实际风速、炉喉温度、铁量、综合品位、矿耗、燃料比、焦比等关键变量。
- 建议采用时间顺序切分进行验证,避免随机切分造成未来信息泄露。
- 建议对大偏差样本进行分段分析,识别异常工况、极端铁量样本和长时长样本。
(三)注意事项
- 严禁在特征构建或验证中使用参考时刻之后的数据。
- 需特别注意变料数据的事件级特性和时间窗口滞后效应。
- 若采用深度学习方案,应注意不同字段量纲差异带来的归一化问题。
- 结果文件中样本编号不得缺失、重复或错位。
十一、赛题约束条件
(一)算法约束
- 禁止使用任何商业闭源在线推理接口或需要联网调用的模型服务。
- 禁止通过人工逐条修正测试结果。
- 禁止使用未来信息、测试标签泄露信息或通过测试集反推标签。
- 进入总决赛的方案须支持离线环境完整运行。
(二)数据使用约束
- 参赛者仅可使用赛事官方提供的数据,严禁使用任何外部公开数据、私有数据或自行采集数据。
- 严禁使用依赖外部数据训练得到的预训练模型权重;允许使用开源算法框架、开源代码库和通用基础依赖库,但不得借助外部数据增强模型能力。
- 禁止传播、转售、公开展示、用于商业用途或泄露赛事数据。
- 所有数据仅授权用于本赛事相关算法研究与评测。
十二、参考资源
(一)文献资料
- XGBoost:AScalableTreeBoostingSystem.KDD2016.
- LightGBM:AHighlyEfficientGradientBoostingDecisionTree.NeurIPS2017.
- CatBoost:unbiasedboostingwithcategoricalfeatures.NeurIPS2018.
- 工业过程数据建模、时间序列回归、多任务学习与异常检测相关公开论文和技术报告。
(二)在线资源
- 吴恩达《MachineLearningSpecialization》(Coursera视频课程)。
- Google《MachineLearningCrashCourse》(含讲解视频与练习)。
- scikit-learn官方MOOC《MachinelearninginPythonwithscikit-learn》。
- 李宏毅《MachineLearning2023Spring》课程页面(含课程视频与课件)。
- fast.ai《PracticalDeepLearningforCoders》(公开视频课程)。
十三、提交要求
(一)初赛、复赛及半决赛提交内容与格式
参赛者需将预测结果保存为CSV文件,并压缩为ZIP文件后提交。结果文件字段要求如下:
- sample_id(字符串/整数):与官方测试样本中的样本编号完全一致。
- pred_tap_iron(浮点数):预测出铁量,单位为吨。
- pred_tap_time_len(浮点数):预测出铁时长,单位为分钟。
CSV文件应使用UTF-8编码,字段名称须与赛事要求完全一致;每个样本编号只能出现一次;不得缺行、重复或附加多余字段。预测值建议保留三位及以上小数。
注:提交限制:每天最多提交 5 次,排行榜实时更新,以最后一次提交为准。
(二)半决赛、总决赛提交内容
- 算法代码:包含数据读取、特征构建、模型训练、模型加载和预测推理等完整代码。
- 模型文件:训练好的模型参数文件或可复现训练脚本。
- 技术报告:PDF或Word格式,不少于3000字。
- README文件:说明运行环境、依赖安装、运行命令和输入输出目录结构。
- requirements.txt或environment.yml文件。
- 如赛事组织方需要,可额外提交演示视频、答辩PPT和补充说明材料。
(三)提交规范
- 所有提交材料须保证可读取、可解压、可运行。
- 初赛、复赛和半决赛提交的ZIP压缩包内须包含且仅包含一个结果文件,结果文件固定命名为result.csv。
- 初赛压缩包命名规则为teamname_bf_tap_predict_prelim.zip,复赛压缩包命名规则为teamname_bf_tap_predict_round2.zip,半决赛压缩包命名规则为teamname_bf_tap_predict_semifinal.zip。
- 若代码与结果无法复现,赛事方有权取消成绩或奖项。
- 最终解释权归赛事主办方所有。
十五、奖金设置
为鼓励参赛者积极参与并支持优秀成果落地,本赛题设置赛事奖金,并为表现突出的选手提供相应的职业发展支持。具体安排如下:
(一)赛事奖金设置
本赛题将根据总决赛的最终综合成绩(含线上客观评测与线下答辩),对全国总决赛一等奖前六名参赛团队按照如下标准颁发奖金:
- 冠军奖:第1名,奖金8000元/每团队
- 亚军奖:第2-3名,奖金6500元/每团队
- 季军奖:第4-6名,奖金3000元/每团队
(二)优秀选手职业发展支持
针对在本赛题中表现突出的优秀选手,出题方还将提供相应的职业发展支持,具体包括以下内容:
- 核心岗位面试直通机会:
在复赛或总决赛中表现突出的核心算法选手,可获得人工智能研究院算法研发岗位的校招优先面试机会。
- 专项精英实习计划:
定向开放工业计算机视觉、大模型前沿应用等核心研发方向的优质实习岗位。受邀实习生可直接参与真实工业项目,并获得相应的业务指导与实践机会。
十六、其他说明
(一)更新与答疑
赛题内容、数据说明、评测细则和基线方案如有更新,以赛事官网和官方答疑群发布的信息为准。
(二)公平性
严禁任何形式的作弊行为,包括但不限于数据泄露、标签泄露、抄袭他人代码、伪造结果和利用非授权数据获取不公平优势等。
(三)知识产权
参赛者提交的作品应保证原创,不得侵犯任何第三方知识产权。比赛主办方有权在赛事宣传、成果展示和学术交流中使用参赛作品的相关内容,具体知识产权归属以赛事公告和双方约定为准。
(四)数据保密与合规
赛事数据为脱敏后的工业数据,仅授权用于本赛事算法研究与评测。参赛者应承诺履行保密义务,不得传播、复用或用于与赛事无关的商业活动。
(五)结果可复现性
进入总决赛的团队需保证提交结果可复现。若官方在指定环境中无法按照提交说明复现主要结果,赛事方有权取消其成绩或奖项。
十七、联系方式
赛题交流QQ群:1092645019
邮箱:liupeng.nanjing@gmail.com
报名官网:www.aicomp.cn
赛题规则:高炉铁次预测_

2025精彩瞬间
大赛回顾
关注我们