谷歌和微软自然语言理解榜单中超越人类表现

近日，科技公司谷歌和微软相继在一份权威自然语言理解榜单中超越人类的表现，微软宣称这“标志着迈向通用人工智能的重要里程碑。”
自然语言理解（natural language understanding，简称nlu）任务在人工智能领域历史悠久，被誉为“人工智能皇冠上的明珠”。由于自然语言本身存在的歧义性或多义性，实现高质量的自然语言理解有相当的难度。
为了衡量人工智能模型的自然语言理解能力，纽约大学、华盛顿大学、facebook和deepmind在2019年合作提出一个名为superglue的人工智能基准测试。superglue由2018年glue演化而来，其语言理解任务难度更大，包括问答、自然语言推理、指代消解和词义消歧等等。
superglue榜单
在最近更新的superglue上，微软的deberta模型和谷歌的t5+meena模型分列第一第二，超越人类基准线（human baseline）。这是人工智能首次在superglue中表现超越人类。
尽管在superglue测试上取得令人满意的结果，但微软坦言，deberta模型还没有达到人类智能的自然语言理解水平。人类非常善于利用从不同任务中学到的知识来解决新的任务，这是ai模型需要学习的地方。
排名第一的微软模型deberta共有15亿个参数。在superglue测试中，单个deberta模型的宏观平均分（89.9分）超过了人类的表现（89.8分）；模型整体得分（90.3分）也超过人类基准线（89.8分），在superglue排名第一。排名第二的t5+meena模型得分90.2，同样超过人类基准线（89.8分）。
在superglue测试中，人工智能模型被要求回答类似这样的问题：
已知“这个孩子对疾病产生了免疫力”，问“这是由什么导致的？”请选择：a.“他避免接触这种疾病”；或b.“他接种了这一疾病的疫苗”。
这是一个简单的因果推理任务，人类很容易选出正确答案。但对人工智能模型而言，却是不小的挑战。为了得出正确答案，模型需要理解已知条件和选项之间的因果关系。

2021年1月6日，微软在博客发文详细介绍此次取得榜首的deberta模型。
deberta全称decoding-enhanced-bert-with-disentangled attention，是一个基于transformer架构的神经语言模型，采用自监督学习方法对大量原始文本语料库进行预训练。deberta的目标是学习通用的语言表达形式，适用于各种自然语言理解任务。deberta主要用到三种新技术，分别是分离注意力机制、增强的掩码解码器和用于微调的虚拟对抗训练方法。
排名第二的t5+meena技术来自谷歌。谷歌团队尚未详细解释其模型在superglue创纪录的原因。但微软在博客文章中评价称，谷歌的t5模型由110亿个参数组成，相比之下，15亿参数的deberta在训练和维护上更加节能，更容易压缩并部署到各种程序中。
微软正在将deberta模型集成到下一代“图灵自然语言生成模型”（turing nlrv4）中。下一步，他们准备向公众公开15亿参数的deberta模型及其源代码。

蓝绿光半导体激光器国产化提速
TA1276AN引脚功能的电压资料参数
备战智能家居，MCU市场主打四大差异牌
多地控制开关电路
新能源电瓶修复—你修的电瓶为什么问题百出
谷歌和微软自然语言理解榜单中超越人类表现
赛微电子：看好智能传感行业发展，不断拓展MEMS工艺平台
电感的基本原理电感的工艺结构
区块链能给跨境支付行业带来哪些便利
3D视觉传感器的精度是指什么
浅谈Photonis Channeltron电子倍增器
小米6的期待值不如它？畅销全世界和OPPO公司亲密
DVI端子/接收制式,DVI端子/接收制式是什么意思
vivo正式公布了Funtouch OS 10适配计划加入了全新的手势1+5功能
5G时代助力智能家电行业蓬勃发展
LTM4641降压型稳压器在工业领域的应用
MWC大会上LG G6叫板华为P10徕卡双摄，反被华为吊打？
北京智同精密公司成功实现了高精密RV减速器的批量化生产
5G云网将是未来所有商业和产业互联网最重要的基础设施
铅电池技术将使得电动汽车充电更优惠