2026AIC·算法挑战赛道赛题一览
2026-05-284,843 次阅读
✨算法挑战赛初赛排行榜于5月10日陆续开放

 

赛题一、基于大模型的多模态视觉理解与推理

赛题概述:

本赛题面向新一代人工智能理解与推理能力的发展需求,围绕语言与多模态视觉联合理解问题展开。传统目标检测只需识别图像中的物体类别并给出其位置,而真实智能体则需具备更高层次的认知能力:理解人类的自然语言描述,并在复杂场景中精准定位所指目标,该问题被定义为视觉定位(Visual Grounding)。大语言模型、多模态大模型与推理大模型的发展,使人工智能逐步具备从语义理解、跨模态关联到复杂场景决策的综合能力。这些模型正在推动人工智能从“感知世界”迈向“理解意图并做出决策”的阶段。然而,在真实环境中,仅依赖单一视觉信息往往难以稳定定位目标,尤其在弱光、遮挡或外观相似物体存在时,对语义与空间一致性的综合理解能力提出了更高要求。本赛题在视觉模态上引入可见光、深度与热红外三种视觉模态,参赛者需要针对复杂光照、遮挡等环境数据完成跨模态语义对齐与推理。

      •  赛题交流QQ群:1083696760(验证信息请注明“学校名称”+“学生姓名”)

      •  邮    箱:xuefeng.zhu@jiangnan.edu.cn

竞赛细则详见:基于大模型的多模态视觉理解与推理

技术方案大纲:基于大模型的多模态视觉理解与推理技术方案大纲

排行榜:基于大模型的多模态视觉理解与推理排行榜

 

赛题二、面向城市场景的视觉多模态目标检测

赛题概述:

本赛题旨在推动复杂城市场景下准确鲁棒的多模态目标检测算法发展,鼓励参赛者通过可见光、热红外与深度多源异构数据融合和检测理论方法的创新改进,有效突破单一模态感知在夜间、逆光及遮挡等极端环境下的局限性,提升算法的泛化性能。本赛题的研究成果不仅有助于促进多模态数据融合理论的深化,更可直接应用于全天候交通监控、恶劣天气自动驾驶导航、城市安防巡检及应急救援探测等关键领域,对改善社会公共安全、提升城市智能化管理水平具有重要的学术价值与现实应用意义。本赛题将提供包含可见光RGB图像、红外Infrared图像和深度Depth图像和的目标检测数据集。参赛队伍需要设计基于三模态数据输入的视觉目标检测算法,充分利用多源异构数据互补信息,实现复杂场景下精确的目标检测。

      •  赛题交流QQ群:1023687056(验证信息请注明“学校名称”+“学生姓名”)

      •  邮    箱:xuefeng.zhu@jiangnan.edu.cn

竞赛细则详见:面向城市场景的视觉多模态目标检测

技术方案大纲:面向城市场景的视觉多模态目标检测技术方案大纲

排行榜:面向城市场景的视觉多模态目标检测排行榜

 

赛题三、无人机低空航拍图像语义分割

赛题概述:

随着低空经济的蓬勃发展,无人机技术在测绘、安防、农业监测及城市规划等领域的应用日益广泛。无人机低空航拍图像具有视角独特、分辨率高、地物细节丰富等特点,但同时也面临着视角变化大、目标尺度差异显著、背景复杂等挑战。语义分割作为计算机视觉的核心任务之一,旨在对图像中的每个像素进行分类,是实现无人机视觉感知智能化的关键。

然而,现有的通用语义分割模型在直接应用于低空航拍场景时,往往因训练数据与航拍数据分布差异(DomainGap)而表现不佳。此外,航拍图像中不同地物类别(如农田、建筑、道路)的分布极不均衡,且测试场景中某些类别的占比可能与训练场景存在显著偏差(如特定区域农田占比过高),这要求模型具备极强的泛化能力和鲁棒性。本赛题希望通过开发高效的无人机低空航拍图像语义分割模型,探索在复杂分布数据环境下提升模型性能的方法,推动无人机视觉技术的落地应用。

      •  赛题交流QQ群:1087228412(验证信息请注明“学校名称”+“学生姓名”)

      •  邮    箱:aicomp2026uav@139.com

竞赛细则详见:无人机低空航拍图像语义分割

技术方案大纲:无人机低空航拍图像语义分割技术方案大纲

排行榜:无人机低空航拍图像语义分割排行榜

 

赛题四、面向噪声标签数据的细粒度图像识别鲁棒微调

赛题概述:

面向标签含噪数据的视觉基础模型鲁棒微调技术,在多个真实场景中具有重要应用价值。例如,在生态监测与生物多样性保护中,需要对大量自然动植物图像进行精细分类,但人工标注成本极高;在农业生产中,需要基于含噪的田间图像识别作物品种、病虫害类型;在智慧林业、自然资源调查、科普教育等领域,也普遍面临“数据海量但标签不准”的问题。通过研究鲁棒微调算法,可以充分利用低成本网络数据,将视觉基础模型快速适配到专业细粒度识别任务中,在降低数据采集与标注成本的同时,提升模型在真实场景中的可用性、稳定性与推广能力。

      •  赛题交流QQ群:1090224462(验证信息请注明“学校名称”+“学生姓名”)

      •  邮    箱:zerens@njust.edu.cn

竞赛细则详见:面向噪声标签数据的细粒度图像识别鲁棒微调

技术方案大纲:面向噪声标签数据的细粒度图像识别鲁棒微调技术方案大纲

排行榜:面向噪声标签数据的细粒度图像识别鲁棒微调排行榜

 

赛题五、基于虚拟染色的免疫组化图像生成

赛题概述:

近年来,基于人工智能的虚拟染色技术逐渐成为数字病理领域的重要研究方向。该类方法通过学习源染色图像与目标染色图像之间的映射关系,在尽量减少额外化学染色实验的前提下生成目标标记图像,从而降低实验成本、缩短分析周期,并提升组织样本处理效率。针对多标记联合建模与跨标记信息利用的研究表明,不同免疫标记之间存在一定关联性,合理利用这类信息有助于提升虚拟染色结果的结构一致性与生成质量。本赛题围绕虚拟染色这一核心问题展开,采用 DAPI 图像作为输入,面向 HLA-DR、CD45RO、Vimentin、CD68 目标标记图像生成任务开展评测。赛题在保证评测可操作性和可复现性的同时,不限制参赛者只能采用单输出方案;在完成官方阶段任务要求的基础上,鼓励参赛者进一步挑战一对多的生成策略。

      •  赛题交流QQ群:1084060012(验证信息请注明“学校名称”+“学生姓名”)

      •  邮    箱:linxue202509@nuaa.edu.cn

竞赛细则详见:基于虚拟染色的免疫组化图像生成

排行榜:基于虚拟染色的免疫组化图像生成排行榜