谷歌开发出一个新的语言模型，包含了超过1．6万亿个参数

开发人工智能的语言模型，一直是人工智能的重要细分领域。人工智能语言模型应用包括搜索引擎、文字生成、个性化的对话工具以及软件生成等。
2020年5月，openai的一组研究人员发布了具有里程碑意义的ai模型gpt-3。gpt-3就是在570 gb的文本数据上训练的语言模型，因此，就训练数据和生成能力而言，gpt-3截至2020年都是最庞大的公开发布的语言模型。
此外，openai的gpt-3一反之前死守基础研究的思路，将 gpt-3 做成了一个服务，提供可以调用的 openai api，并且向开放了少量体验资格，使得拿到体验资格的业界人士或学者等，开发出了一众惊人的演示。
包括答题、翻译、写文章，甚至是数学计算和编写代码。而由gpt-3所写的文章几乎达到了以假乱真的地步，在 openai 的测试中，人类评估人员也很难判断出这篇新闻的真假，检测准确率仅为 12%。
但现在，谷歌研究人员开发出一个新的语言模型，它包含了超过 1．6 万亿个参数，远超 open ai 开发的 gtp-3 的规模（1750 亿个参数），成为迄今为止最大规模的人工智能语言模型，比之前谷歌开发过最大的语言模型 t5-xxl 的效率提高了 4 倍。
该语言模型使用 switch transformer 方法进行大规模训练，这是一种“稀疏激活”技术，它只使用模型权重的子集或在模型中转换输入数据的参数，以有效降低计算密集度。
尽管在部分实验中，该模型相比规模更小的模型得到了较低分数。但在相同的计算资源下，预训练速度提高了7倍。这些改进扩展到多语言设置中，我们在所有101种语言中测量mt5基本版本的增益。最后，我们通过在“巨大的干净的爬虫语料库”上预先训练多达万亿个参数的模型，提高了语言模型的当前规模，并实现了比t5-xxl模型4倍的加速。
研究人员认为，稀疏性可以在未来赋予该模型在一系列不同媒体下多模态的优势。这也为人工智能语言模型的深入研究提供了更多方向的参考。

土壤检测仪的测试项目
快速温变试验箱、快速温度变化试验箱的特点
分析一下云计算解决方案对中国市场的影响
受芯片短缺影响,高通Q1季报不及预期
三星Galaxy A02和Galaxy M02手机已通过蓝牙SIG权威认证
谷歌开发出一个新的语言模型，包含了超过1．6万亿个参数
老字号VR地图2.0版本上线北京老字号门店数量增至163家
中国联通开启接入网局端OLT设备和MDU设备的测试
浅析低成本CMOS图像传感器对医学技术发展前景
恩智浦最新Wi-Fi6射频前端解决方案，将应用于小米Mi10 5G手机
有源器件有哪些_二极管是有源器件吗_有源器件范围
如何成为一个优秀的驱动开发工程师
实地体会这条正日益茁壮的电子业大动脉
智能家居的诞生给人们带来了更加高品质的生活
吴振志：超高清显示领域迎来了新的发展机遇
ZB级数据爆发时代，智慧视频带来存储变革
木林森发布公告披露了2020年半年报及前三季业绩预告
OPPOR7s手机怎么样值不值得买
自动点胶机点胶不良率高是什么原因？
在数据中心领域，芯片之争早成定局