Skip to content

APOAI 2026 T4 Spot the Spots

  • 来源:noai-mis/APOAI/2026/T4
  • 类型:CV / fine-grained recognition
  • 原始资料:statement.mdbaseline.ipynbcattrain_v2/train.csv
  • 题面完整性:完整
  • 解法资料完整性:有 baseline;无独立题解,以下结合题面推断

题面大意

任务是识别北京郊区豹猫的具体个体。训练集 780 张,验证/测试各 155 张,共 1090 张高质量标注图。输入是相机陷阱拍到的豹猫,目标是细粒度分类/个体 ReID。题目允许使用指定预训练模型,环境为 ioai3.7

数据特点

同一物种不同个体差异细微,主要来自斑点花纹、脸部特征、体态局部;同时图像存在白天/夜间红外、背景杂乱、姿态变化、遮挡和尺度差异。训练样本不多,类别可能不均衡。简单 species 分类无意义,必须关注个体级局部纹理。

考点

核心考点是细粒度识别和小数据迁移学习。模型需要保留高分辨率纹理,并避免被背景、相机位置和光照误导。预训练 backbone、数据增强、裁剪策略和验证集调参都很关键。

涉及知识点

  • Fine-grained image classification。
  • Individual ReID / metric learning。
  • 预训练 CNN/ViT 微调。
  • 局部特征、attention、test-time augmentation。
  • 类别不平衡和小样本过拟合。

解法思路

基础方案是用预训练 backbone(如题目提供的 Swin/TinyViT 相关权重)微调分类头。图像 resize/crop 时要保留豹猫主体和斑点纹理,随机裁剪不能过度裁掉身体。训练中使用颜色扰动、水平翻转、随机擦除等增强,验证集选择最佳 epoch。

更强方案是分类 + metric learning:用交叉熵训练个体分类,同时加入 ArcFace/Triplet/contrastive loss,使同个体 embedding 更近、不同个体更远。推理时可用分类概率,也可用 embedding 与训练集原型做最近邻/融合。对夜间红外和白天图像,可做灰度/颜色增强提升域鲁棒性。

可选/多种解法

预训练分类微调:最直接,效果通常强。

Embedding 原型检索:适合 ReID 视角,能减轻分类头过拟合。

多裁剪/TTA 集成:对姿态和局部斑纹变化更稳。

特殊技巧

主体定位很重要。如果背景占比过大,模型可能记住相机位置。可以用简单阈值/检测裁剪豹猫区域,或使用较大输入分辨率保留斑点细节。夜间红外图像颜色信息弱,纹理和形状更重要;增强中应模拟灰度和亮度变化。

调参优化

题解已有线索是小数据迁移学习、主体裁剪、高分辨率纹理和多 seed。调参优先级建议为:输入分辨率与裁剪策略、冻结/解冻层数、backbone 学习率与分类头学习率比例、颜色/灰度增强强度、随机擦除概率、label smoothing 和 TTA。验证集只有 155 张,单次最优参数不可靠,应使用多 seed 或按个体分层的交叉验证检查稳定性。若加入 ArcFace/Triplet,需额外调 margin、embedding 维度和分类 loss/metric loss 权重,避免检索特征提升但分类概率下降。

注意事项

这是 APOAI 2026 中唯一使用 ioai3.7 的题,因为允许的预训练模型特殊。提交标签为 numeric individual ID。验证集只有 155 张,调参容易过拟合,最好用多 seed 或交叉验证思想检查稳定性。

推广意义

这题代表生态监测中的个体重识别需求。相同技术可用于雪豹/鲸鱼/斑马等自然个体识别,也可推广到工业零件细粒度识别和 ReID。