Appearance
IOAI 2025 Restroom Icon Matching
- 来源:
noai-mis/IOAI/IOAI-2025/Individual-Contest/Restroom - 类型:CV / retrieval and ReID
- 原始资料:
Restroom.ipynb、Solution/Restroom_Solution.ipynb、metrics.py - 题面完整性:notebook 内完整
- 解法资料完整性:有 solution notebook
题面大意
给定一个 restroom 的男/女图标图像,任务是找到同一 restroom 中跨性别对应的另一张图标。例如给男厕裁剪图,检索同 restroom 原图中的女厕图标。目标是学习同一场景/同一设计风格下的图标配对关系。
数据特点
图标形状简洁但风格多变,存在颜色、背景、裁剪尺度、拍摄角度和原图/裁剪图差异。任务本质是检索匹配,而不是单纯分类;同一个 restroom 的男女图标通常共享设计语言、位置关系或材质风格。
考点
核心考点是跨域图像匹配和 ReID。模型需要提取风格/形状 embedding,使同 restroom 的跨性别图标更近,不同 restroom 更远。
涉及知识点
- Siamese network / metric learning。
- CLIP/ReID embedding。
- Pairwise similarity 与 top-k retrieval。
- 图像预处理:裁剪、归一化、背景去除。
- 检索评估。
解法思路
基础方案是用预训练视觉 backbone 提取图像 embedding,计算 query 与候选图标的 cosine similarity,选最近邻。更强方案使用训练对做 metric learning:同 restroom 跨性别为正样本,不同 restroom 为负样本,训练 contrastive/triplet loss 或分类式匹配头。
若原图中包含多个候选区域,需要先检测/裁剪出图标,再做 embedding 匹配。图标任务中边缘形状很重要,灰度化、边缘图或背景去除可能提升泛化。
可选/多种解法
CLIP/视觉 embedding 最近邻:强基线。
Siamese 微调:对任务特定风格更敏感。
图像处理 + 形状描述符:适合简单图标,速度快。
特殊技巧
男女图标语义不同,但同 restroom 设计风格相似,因此不要只学“男像男、女像女”的分类特征。可把颜色直方图、边缘轮廓和局部纹理结合。查询裁剪图和候选原图尺度不同,统一裁剪/居中很重要。
调参优化
这类视觉检测/状态识别题应按最终业务指标调阈值,而不是只看分类准确率。若用分类模型,重点调输入分辨率、ROI 裁剪、类别权重、学习率、增强强度和概率阈值;若用检测/分割思路,还要调置信度阈值、NMS 阈值和最小目标面积。卫生间场景容易受视角和遮挡影响,验证集要覆盖不同摄像头/场景;如果某个场景误差大,优先调裁剪与颜色/亮度增强,而不是盲目增加 epoch。
注意事项
题目描述中 query 可能是裁剪图,candidate 可能来自原图,数据路径和 id 对齐要仔细。检索任务通常一行一个 query,提交候选 id,格式以 notebook 为准。
推广意义
这题对应实际视觉检索/ReID:同一实体跨视角、跨域、跨外观匹配。方法可用于商品同款、图标库去重、门店招牌匹配等。