据外媒报道,facebook近日推出reagent强化学习(reinforcement learning)工具包,首次通过收集离线反馈(offline feedback)来实现策略评估(policy evaluation)。
目前reagent已与microsoft azure顶尖ai平台实现合作。
一、“1+1+1”
facebook ai research近日推出了reagent,这是一种强化学习工具包,用于构建可以接收反馈的决策ai(decision-making ai)。reagent可以给用户行为评分,并将用户的输入行为(例如单击推荐内容)作为训练数据。
reagent是一个小型c ++库,可从github下载,并在任何应用程序中嵌入。该工具包包含一组入门的决策ai模型,一个用于模型性能评估的离线模块,以及一个使用torchscript库将ai部署到生产中的平台。
horizon是一个强化学习平台,曾用于facebook 2018年11月的开源生产中,现已成为reagent的一部分。
二、建立大规模实时决策ai模块变得简单
应用研究负责人srinivas narayanan近日在facebook的@scale会议上说,reagent现在每天要将数十亿个facebook上的决定个性化(personalized),例如facebook和instagram上的用户通知。
facebook曾在博客中提到:“reagent是各类创建ai推理系统(ai-based reasoning systems)的开源平台中最全面和模块化的,并且是第一个通过收集离线反馈来实现策略评估,从而改进模型的。”
“reagent让建立大规模的实时决策模块变得简单,同时也让创建和评估研究项目以及生产应用中的策略变得平民化(democratized)。
三、与microsoft azure合作
为了继续改进reagent,facebook发布了将其应用在microsoft azure等云服务中的文档。microsoft azure今年年初推出了自己的强化学习服务。
▲图片来源:microsoft,图中为microsoft azure的全球服务地区
在今年夏天transform会议上的一次对话中,openai首席技术官greg brockman和首席科学家ilya sutskever认为,未来ai发展的核心就是推理( reasoning)和可解释性(explainability)。
结语:开源是好事,也是大势所趋
谷歌和微软作为ai两大巨头,均有自己的开源ai开发平台,如谷歌的google cloud prediction api和微软的microsoft azure machine learning。
如今facebook也发布了自己的开源ai工具包。ai领域的研发门槛在不断降低,一些中小创企得以加入这场竞赛,也让这个领域不断注入新鲜的血液,充满活力。
充分竞争,交流融合,才会有更多灵感的迸发。
散步般的拖地体验,电动拖把有用吗?
12G+128G电光蓝 iQOO新配置4月14号全网预约
在自然防烟的楼梯间需要设置上余压监控系统吗
天马工业品产品新策略发布媒体见面会
Synopsys收购QTronic GmbH
Facebook推出ReAgent AI强化学习工具包
福特的送货机器人终于有腿啦!
传三星4nm良率水平追平台积电,3nm提至60%以上
三航局中标华能苍南4号海上风电场项目风机基础及风机安装工程
传感器技术,可穿戴设备和物联网的技术发展保持同步
电动机轴承损坏的因素有哪些
浅谈芯片间互联技术CCIX分层结构及拓扑结构
特斯拉为何要选择4D毫米波雷达?
基于全新Willow Cove CPU 核心 技术
瑞萨电子2012年度创史上最大亏损纪录
为蔚来提供激光雷达的“海创光电”冲刺科创板
RJ45与RJ11接口的区别与相同点是什么?
中国电信宣布与盾量子合作“量子铸盾行动”
KTS-442LLCN红外激光全站仪
2018全球30家主要FPC制造企业