『百度』横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军


机器之心发布
机器之心编辑部
这两天 , 全球规模最大的语义评测比赛 SemEval 2020 结果出炉 , 百度基于飞桨平台自研的语义理解框架 ERNIE 一举斩获 5 项世界冠军 , 囊括视觉媒体的关键文本片段挖掘、多语攻击性语言检测和混合语种的情感分析 。
『百度』横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军
本文插图
SemEval 是全球范围规模最大、参赛人数最多的权威语义评测竞赛 。 其由国际计算语言学协会(Association for Computational Linguistics, ACL)的 SIGLEX 主办 。 自 2001 年起 , SemEval 已成功举办十四届 , 在业界和学术界具有极高影响力 。 此次 SemEval 将和自然语言处理领域的顶级会议 COLING 联合举办 。
ERNIE 是此次五项世界冠军背后的「趁手利器」 。 去年 , ERNIE先后完成两版重大升级 。 ERNIE 1.0 提出知识增强的语义表示模型 , 而 ERNIE 2.0 则构建了持续学习语义理解框架 , 在中英文 16 个任务上超越业界最好模型 。 此后 , ERNIE 模型再次改进 , 以历史上首次超越 90 大关的成绩登顶自然语言处理领域最权威的 GLUE 评测榜单 。 本次比赛 , ERNIE 再度创新 , 再立战功 , 夺得五项世界冠军 。
让 AI 更懂「轻重」:视觉媒体的关键文本片段挖掘
该任务由美国休斯顿大学、Adobe 美国研究院联合举办 , 旨在自动挖掘海报、广告、传单等视觉媒体中文本的关键片段 , 对其进行重点设计 , 提升宣传效果 。 由于人们对于同一文本重要内容的判断不一致 , 在没有唯一标准的情况下 , 该任务存在极大的难度 。
百度 ERNIE 团队采用多种技术手段解决这个难题:首先 ERNIE 模型作为语义信息提取模块 , 对各片段重要性进行建模;然后针对关键片段标准不统一的问题 , 设计了更贴近目标的 5 Label 的 Pairwise 损失函数;最后从数据出发构造了多种针对性的语义特征以及数据增强策略 , 最终以 5 项指标全部第一的成绩获得冠军 。
『百度』横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军
本文插图
比赛中 , 主办方 Adobe 希望将赛题的解决方案应用于 Adobe Spark , 赋予其海报自动设计能力 , 以达到更好的宣传效果 。 如下图所示的「ERNIE」、「轻重」的黑白效果就是自动挑选的结果 。 百度 ERNIE 团队采用 ERNIE 让 AI 更懂文字的「轻重」 , 释放广大视觉设计者的劳动力 , 使其能够更专注于对核心内容的设计 。 此外 , 该项技术已应用于百度搜索 , 能够动态分析出用户查询内容中的重要片段 , 使其返回更精准的搜索结果 , 让百度更懂您 。
『百度』横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军
本文插图
让世界更有 AI:多语攻击性语言检测
该任务由多个国家的研究机构联合举办 。 其中包括了英国剑桥大学、美国 IBM 研究院、以及来自德国、丹麦、卡塔尔的多所著名大学和研究院 。 该任务包含了三个子任务:
第一个子任务是在对英语、丹麦语、希腊语、阿拉伯语和土耳其语等包含五种语言的社交媒体进行攻击性检测 。 百度 ERNIE 团队构建了大规模的多语预训练模型 , 充分挖掘海量的多语无监督文本 , 用相同的模型来学习所有语种的语义表示 , 使模型具备跨语言的理解和分析能力 。 同时 , 采用 Multi-lingual Fine-tuning 的方法 , 利用其他语言的知识辅助建模 , 最终以五项语言平均分第一名的成绩取得冠军 。
另外两个任务是在英语环境中对攻击性语言的类型和目标分别进行更加精细化的分析 。 百度 ERNIE 团队通过数据蒸馏的技术 , 从更多无监督的网络文本中学习多种模型的 Soft Label , 分别以 F1 超过第二名 1.0% 和 4.4% 的绝对优势取得了冠军 。