如何用EasyDL专业版实现模型精度的逐步优化( 二 )

  限于篇幅 , 我们简单对其中的一些参数进行介绍 。

  模型输入尺寸(input size): 模型的输入尺寸指的是训练数据实际输入到模型中的尺寸, 一般来说大的输入尺寸有助于模型对小目标的学习 , 但大的输入尺寸会降低模型的推理速度 , 因此该参数的调节要根据实际去选择 。

  学习率衰减策略((lr decay): 学习率是模型训练中非常重要的超参数 , 训练初期配置较大学习率 , 训练后期逐步降低学习率可以帮助模型收敛到更优解 。 用户可通过配置lr_decay=True来使用学习率衰减策略 。

  Anchor配置参数(aspect_ratios): 基于anchor原理的物体检测模型对于先验的anchor高宽比的选择有一定要求 , 基于数据集特性去调整anchor参数可以让模型更好地学习到定位物体的能力 。

  针对货架挡板高宽比较极端的特性 , 我们对代码模板的anchor参数进行调整 。 调整策略可以选用对标注数据聚类等方法 , 我们通过自研的高宽比自适应能力对宽高比进行优化 , 发现特定的aspect_ratios修改如下图3可以很好的适应货架挡板数据集 , 再次训练模型 , 如图4 , Faster R-CNN模型效果从0.812提升到0.87 。 后续高宽比自适应的能力会以可选组件的方式开放给用户 。


如何用EasyDL专业版实现模型精度的逐步优化

----如何用EasyDL专业版实现模型精度的逐步优化//----

  图3. Anchor优化


如何用EasyDL专业版实现模型精度的逐步优化

----如何用EasyDL专业版实现模型精度的逐步优化//----


如何用EasyDL专业版实现模型精度的逐步优化

----如何用EasyDL专业版实现模型精度的逐步优化//----

  图4. Anchor优化效果提升

 

 其次介绍下数据方面的优化机制 。

  深度学习模型的成功很大程度上要归功于大量的标注数据集 。 通常来说可以通过增加数据规模、增加数据多样性及增加实际场景数据等方面来提升模型效果 。

  从增加数据多样性角度出发 , 专业版开发了自动数据增强搜索能力 , 可以根据数据集特征自动搜索出适用于特定数据集的数据增强策略组合 。

  实践中收集数目庞大的高质量数据并不是一件简单的事 , 在某些特定领域甚至无法获取大量数量 。 那么如何能在有限数据的情况下尽可能提升模型的效果呢?

  数据增强通过对数据本身进行一定程度的扰动从而产生"新"数据 , 模型通过学习大量的"新"数据 , 提高了模型的泛化能力 。 但数据增强策略的手动配置依赖于使用者对于实际场景的理解 , 因此会存在难以选取有效数据增强策略的情况 。