43-树叶分类竞赛技术总结
43-树叶分类竞赛技术总结
目录
1. 比赛结果
- 176 类,18353 训练样本
- 165 只队伍参加
- 41 只队伍精度 > 98% (非常好)
- 83 只队伍精度 > 95% (够用)
2. 结果分析
-
16 只队伍提供了代码:
-
额外加上 Neko Kiku
- 很多人参考了此代码 simple resnet baseline | Kaggle
3. 技术分析
相比于课程介绍的代码,同学们主要做了下面这些加强:
-
数据增强,在测试时多次使用稍弱的增强然后取平均
-
使用多个模型预测,最后结果加权平均
- 有使用 10 种模型的,也有使用单一模型的
-
训练算法和学习率
-
清理数据
4. 模型方面
-
模型多为 ResNet 变种
- DenseNet,ResNeXt,ResNeSt, …
- EfficientNet
-
优化算法多为 Adam 或其变种
-
学习率一般是 Cosine 或者训练不动时往下调
5. AutoGluon
- 15 行代码, 安装加训练耗时 100 分钟
- 精度 96%
- 可以通过定制化提升精度
- 下一个版本将搜索更多的模型超参数
- AG 目前主要仍是关注工业界应用上,而非比赛
6. 总结
- 提升精度思路:根据数据挑选增强,使用新模型、新优化算法,多个模型融合,测试时使用增强
- 数据相对简单,排名有相对随机性
- 在工业界应用中:
- 少使用模型融合和测试时增强,计算代价过高
- 通常固定模型超参数,而将精力主要花在提升数据质量
比赛/学术界:固定数据,调模型
工业界:固定模型,调数据