(文章来源:教育新闻网)
光学传感器(例如相机和激光雷达)是现代机器人平台的基本组成部分,但它们有一个共同的缺陷:玻璃容器之类的透明物体容易使它们混淆。这是因为分析来自这些传感器的数据的大多数算法都假定所有表面都是朗伯型的,或者它们在各个方向和各个角度均均匀地反射光。相反,透明物体既折射又反射光,从而使深度数据无效或充满噪声。
为了寻找解决方案,一组google研究人员与哥伦比亚大学和综合ai(一种用于计算机视觉的数据生成平台)合作开发了cleargrasp。这是一种能够从rgb图像估计透明对象的准确3d数据的算法,重要的是,该算法可与任何标准rgb相机的输入配合使用,使用ai重构透明对象的深度并将其推广到训练期间看不到的对象。
正如研究人员所指出的那样,训练复杂的ai模型通常需要大量的数据集,并且由于不存在透明物体的主体,他们创建了自己的包含超过50,000个逼真的渲染的图像,这些渲染具有相应的深度,边缘,表面法线(代表表面曲率),和更多。每个图像最多显示五个透明物体,这些物体可以放在平坦的地平面上,也可以放在装有各种背景和照明的手提袋中。一个带有相应地面真实深度的286张真实世界图像的单独集合用作测试集。
cleargrasp总共包括三种机器学习算法:一种用于估计表面法线的网络,一种用于遮挡边界(深度不连续)的网络以及一种用于遮盖透明对象的网络。此蒙版会删除属于透明对象的所有像素,以便可以填充正确的深度,因此优化模块可以使用预测的表面法线来扩展表面的深度,以指导重建的形状。(预测的遮挡边界有助于保持不同对象之间的分离。)
在实验中,研究人员在其自定义数据集以及开放源代码matterport3d和scannet语料库中的真实室内场景中训练了模型。他们说,cleargrasp设法为保真度比基线方法高得多的透明对象重建深度,并且其输出深度可以直接用作使用图像的操纵算法的输入。当使用机器人的平行颚爪抓臂时,透明物体的抓握成功率从12%提高到74%,并且通过吸力从64%提高到86%。
High-Speed Random-Data Generat
映泰发布一款ITX迷你板U套装“A10N-9830E” 集成FX-9830P处理器
英特尔明年推用于存储和服务器的凌动(Atom)处理器
L4960/4962单片集成开关电源,L4960/4962 switching power supply
微捷码全新Talus Vortex FX集成电路实现解决方案
AI模型可帮助机器人更好地识别透明物体
一文详解VR和6DoF设计原则
什么是智慧工地人脸识别考勤机系统?
苹果AR/VR头戴设备的处方眼镜设计方案曝光
可超出想象的AI使用 恩智浦助力AI理解再度增强
苹果三星吓哭!兰博基尼这手机竟卖1万多
Achronix宣布用于SoC加速的Speedcore嵌入式FPGA IP产品开始供货
电流互感器的精度
英特尔携手微软打造多行业绿色科技典范
人工智能是否有自己的独立人格
“新基建”下的机器人产业,迎来蓬勃发展的黄金时期
魅族Pro7什么时候上市?魅族Pro7发布会倒数第9天!魅族pro7官方开启预热,你好奇的配置与价格即将揭晓
常见变容二极管的参数
魅蓝5s评测 入门新选择依旧诚意满满
华为Nova2、华为Nova2plus发布会就在今天,两位神秘代言人?约嘛