如何用EasyDL专业版实现模型精度的逐步优化( 三 )
自动数据增强搜索可以在有限的增强算子组合的搜索空间内搜索出适用于本数据集的数据增强算子组合 。
针对货架挡板案例 , 基准模型上再加上自动数据增强搜索 , 效果从0.812提升到0.832 。 在anchor优化的基础上再叠加上自动数据增强搜索 , 依然能获得正向收益 , 如图5 , 效果从0.87提升到0.881 。
----如何用EasyDL专业版实现模型精度的逐步优化//----
图5 数据增强效果对比
从增加数据规模角度出发 , 专业版开发了多人标注/智能标注能力 , 降低用户的数据标注成本 , 帮助用户快速扩大数据规模 。
多人标注可以将标注任务切分成多份数据集 , 让多个用户同时进行数据标注任务 , 暂时多人人标注仅支持经典版 , 后续会在专业版中开放 。
智能标注会从数据集所有图片中筛选出最关键的图片并提示需要优先标注 。 因此用户只需标注数据集30%左右的数据即可训练模型 。 与标注所有数据后训练相比 , 模型效果几乎等同 。
利用多人标注/智能标注能力 , 可以快速扩大数据规模 。
针对货架挡板案例 , 我们使用智能标注能力 , 在短期内将数据规模从97扩大到400张 。 利用扩大数据集再进行模型训练 , 期望模型效果能再有提升 。
但由于数据规模发生了改变 , 平台自动随机切分产生的验证集存在不一致的现象 , 因此无法用训练中的评估指标来客观评价两个模型的性能 。 针对这个问题 , 我们可以采用平台提供的独立评测集功能来客观评价单个模型的性能 , 进而对比两个模型的性能 。
独立标注27张数据作为评测集 , 上传训练模型后 , 可以发现经过智能标注扩大数据规模后 , 效果从0.884提升到0.909 , 效果对比如图6 。
----如何用EasyDL专业版实现模型精度的逐步优化//----
(1) 97张数据集在评测集上效果
----如何用EasyDL专业版实现模型精度的逐步优化//----
(2) 400张数据集在评测集上效果
图6. 智能标注效果对比
3)从增加实际场景数据角度出发 , 专业版开发了数据闭环能力 , 帮助用户实现实际场景数据优化模型的数据流闭环 , 可以进一步提升模型的泛化能力 。
针对Faster R-CNN效果优化总结如下表3 , 单模型效果提升超过9% , 模型效果有显著提升 。
- 「TalkingData」打造智能化的小微企业信用评估体系?,如何用数据+算法
- 「Wi-Fi」教你如何用AiMesh实现大户型WiFi全覆盖
- [数码盟]网友:单模5G要他何用?,三星下血本!去年旗舰跌至3088
- [潮库]买到理想价位的球鞋,他们如何用海外折扣信息、满减优惠券等技巧
- 「华为」守着金矿饿肚子,金融行业如何用好用户画像?
- 「聚成教育」如何用Excel制作出库入库表
- 「人人都是产品经理」如何用数学函数去理解机器学习?
- 如何用大数据打通聆听玩家声音的路
- 如何用Excel表格制作成绩查询系统?这所学校用易查分三分钟完成自建
- 『科钛网』详解柔性电子技术如何用来应对新冠疫情
