Skip to content

IOAI 2025 Restroom Icon Matching

  • 来源:noai-mis/IOAI/IOAI-2025/Individual-Contest/Restroom
  • 类型:CV / retrieval and ReID
  • 原始资料:Restroom.ipynbSolution/Restroom_Solution.ipynbmetrics.py
  • 题面完整性:notebook 内完整
  • 解法资料完整性:有 solution notebook

题面大意

给定一个 restroom 的男/女图标图像,任务是找到同一 restroom 中跨性别对应的另一张图标。例如给男厕裁剪图,检索同 restroom 原图中的女厕图标。目标是学习同一场景/同一设计风格下的图标配对关系。

数据特点

图标形状简洁但风格多变,存在颜色、背景、裁剪尺度、拍摄角度和原图/裁剪图差异。任务本质是检索匹配,而不是单纯分类;同一个 restroom 的男女图标通常共享设计语言、位置关系或材质风格。

考点

核心考点是跨域图像匹配和 ReID。模型需要提取风格/形状 embedding,使同 restroom 的跨性别图标更近,不同 restroom 更远。

涉及知识点

  • Siamese network / metric learning。
  • CLIP/ReID embedding。
  • Pairwise similarity 与 top-k retrieval。
  • 图像预处理:裁剪、归一化、背景去除。
  • 检索评估。

解法思路

基础方案是用预训练视觉 backbone 提取图像 embedding,计算 query 与候选图标的 cosine similarity,选最近邻。更强方案使用训练对做 metric learning:同 restroom 跨性别为正样本,不同 restroom 为负样本,训练 contrastive/triplet loss 或分类式匹配头。

若原图中包含多个候选区域,需要先检测/裁剪出图标,再做 embedding 匹配。图标任务中边缘形状很重要,灰度化、边缘图或背景去除可能提升泛化。

可选/多种解法

CLIP/视觉 embedding 最近邻:强基线。

Siamese 微调:对任务特定风格更敏感。

图像处理 + 形状描述符:适合简单图标,速度快。

特殊技巧

男女图标语义不同,但同 restroom 设计风格相似,因此不要只学“男像男、女像女”的分类特征。可把颜色直方图、边缘轮廓和局部纹理结合。查询裁剪图和候选原图尺度不同,统一裁剪/居中很重要。

调参优化

这类视觉检测/状态识别题应按最终业务指标调阈值,而不是只看分类准确率。若用分类模型,重点调输入分辨率、ROI 裁剪、类别权重、学习率、增强强度和概率阈值;若用检测/分割思路,还要调置信度阈值、NMS 阈值和最小目标面积。卫生间场景容易受视角和遮挡影响,验证集要覆盖不同摄像头/场景;如果某个场景误差大,优先调裁剪与颜色/亮度增强,而不是盲目增加 epoch。

注意事项

题目描述中 query 可能是裁剪图,candidate 可能来自原图,数据路径和 id 对齐要仔细。检索任务通常一行一个 query,提交候选 id,格式以 notebook 为准。

推广意义

这题对应实际视觉检索/ReID:同一实体跨视角、跨域、跨外观匹配。方法可用于商品同款、图标库去重、门店招牌匹配等。