如何用EasyDL专业版实现模型精度的逐步优化( 三 )

  自动数据增强搜索可以在有限的增强算子组合的搜索空间内搜索出适用于本数据集的数据增强算子组合 。

  针对货架挡板案例 , 基准模型上再加上自动数据增强搜索 , 效果从0.812提升到0.832 。 在anchor优化的基础上再叠加上自动数据增强搜索 , 依然能获得正向收益 , 如图5 , 效果从0.87提升到0.881 。


如何用EasyDL专业版实现模型精度的逐步优化

----如何用EasyDL专业版实现模型精度的逐步优化//----

  图5 数据增强效果对比

  从增加数据规模角度出发 , 专业版开发了多人标注/智能标注能力 , 降低用户的数据标注成本 , 帮助用户快速扩大数据规模 。

  多人标注可以将标注任务切分成多份数据集 , 让多个用户同时进行数据标注任务 , 暂时多人人标注仅支持经典版 , 后续会在专业版中开放 。

  智能标注会从数据集所有图片中筛选出最关键的图片并提示需要优先标注 。 因此用户只需标注数据集30%左右的数据即可训练模型 。 与标注所有数据后训练相比 , 模型效果几乎等同 。

  利用多人标注/智能标注能力 , 可以快速扩大数据规模 。

  针对货架挡板案例 , 我们使用智能标注能力 , 在短期内将数据规模从97扩大到400张 。 利用扩大数据集再进行模型训练 , 期望模型效果能再有提升 。

  但由于数据规模发生了改变 , 平台自动随机切分产生的验证集存在不一致的现象 , 因此无法用训练中的评估指标来客观评价两个模型的性能 。 针对这个问题 , 我们可以采用平台提供的独立评测集功能来客观评价单个模型的性能 , 进而对比两个模型的性能 。

  独立标注27张数据作为评测集 , 上传训练模型后 , 可以发现经过智能标注扩大数据规模后 , 效果从0.884提升到0.909 , 效果对比如图6 。


如何用EasyDL专业版实现模型精度的逐步优化

----如何用EasyDL专业版实现模型精度的逐步优化//----

  (1) 97张数据集在评测集上效果


如何用EasyDL专业版实现模型精度的逐步优化

----如何用EasyDL专业版实现模型精度的逐步优化//----

  (2) 400张数据集在评测集上效果

  图6. 智能标注效果对比

  3)从增加实际场景数据角度出发 , 专业版开发了数据闭环能力 , 帮助用户实现实际场景数据优化模型的数据流闭环 , 可以进一步提升模型的泛化能力 。

  针对Faster R-CNN效果优化总结如下表3 , 单模型效果提升超过9% , 模型效果有显著提升 。