比深度神经网络速度还快的是什么?
或许光子dnn可以回答这个问题。
现在,美国研究者开发的一个光子神经网络 (photonic deep neural network,pdnn),让图像识别仅需1纳秒。
1纳秒是什么概念?它等于10-9秒,这与最先进的微芯片单时钟周期(最小的时间单位)相当。
此外,研究者测试发现,pdnn对图像进行2分类和4分类的准确率分别高达93.8%和89.8%。
诚然,如今的大型多层神经网络高效且运算能力很强,但其也受到硬件的限制,往往需要消耗大量的电力资源等。
而宾夕法尼亚大学的工程师们研发的pdnn,能够直接分析图像,不需要时钟、传感器或大型存储模块,以有效降低耗能。相关研究成果于近日登上了nature杂志。
光子dnn比传统dnn更快
和传统dnn相比,光子dnn的原理和性能有何不同?
先来看看传统dnn:
图a是传统dnn的结构示意图,包括一个数据排列单元,然后是输入层、几个隐藏层,和一个提供分类输出的输出层。
图b展示了传统n输入神经元的结构:输入的线性加权和,通过一个非线性激活函数,产生神经元的输出。
图c和图d分别是一个pdnn芯片的神经网络示意图和n输入神经元结构。
首先在一个5×6光栅耦合器上形成输入图像,然后将其排列成4个重叠的子图像,子图像的像素被传送到第一层神经元,形成一个卷积层。
后面的神经元与它们的前一层完全连接,该网络产生2个输出,可最多为4种图像信息分类。
对于这些神经元,其输入都是光学信号。
在每个神经元中,线性计算是通过光学方式进行的,而非线性激活函数是通过光电子方式实现的,从而可使分类时间低于570ps(=0.57ns)。
论文的通讯作者,电气工程师firooz aflatouni对这个pdnn的性能补充描述道:它每秒可以对近18亿张图像进行分类,而传统的视频帧率是每秒24至120帧。
这里的pdnn芯片电路被集成在仅9.3 mm2 的面积内,不需要时钟、传感器以及大型存储模块。
一个激光器被耦合到芯片内,为各个神经元提供光源;该芯片包含两个5×6的光栅耦合器,分别作为输入像素阵列和校准阵列。
不过,均匀分布的供给光每个神经元光提供了相同的输出范围,显然这将允许将其扩展到更大规模的pdnn。
光子dnn芯片的图像分类测试
研究者们让这个pdnn微芯片识别手写字母。
一组实验测试了pdnn芯片的二分类性能:需要对共计216个「p」和「d」字母组成的数据集进行分类。
该芯片准确率高于93.8%。((92.8%+94.9%)/2)
另一组实验测试了pdnn芯片的四分类性能:需对共计432个「p」、「d」、「a」、「t」字母组成的数据集进行分类。
该芯片分类准确率高于89.8%。
这些结果表明,即使有更多的类(如分四类情况),且存在打印机引起的变化和噪声,pdnn芯片仍取得了较高的分类精度。
为了比较这个pdnn和传统dnn的图像分类准确性,研究者还测试了在python中使用keras库实现的190个神经元组成的dnn,结果显示:它在相同图像上的分类准确率为96%。
什么是电力电容器,电力电容器的基本知识介绍
双十一首战,华为麒麟手机力压苹果iPhone
简单的对讲电路分享
[图文]18W D类单片音频放大器TDA7481
工信部完善政策解决新能源汽车充电难问题
比1纳秒光速更快的图像识别技术研究
2019新iPhone将新增绿色并改用Type-C接口
三星Galaxy Indulge 4G智能手机曝光
莱迪思证明移动应用的FPGA非常适合用于量产
22nm 3D三栅极晶体管技术详解
源卓微纳斩获陶瓷基板行业全球头部厂商订单
应用案例:科技赋能,让物流园区更具“智慧”
企鹅医生构建的线上线下服务体系蓝图的落地,加快未来智能医疗化
uc3842引脚图 uc3842引脚功能
微软Windows 10获得全新用户界面
罗德与施瓦茨宣布针对5G NR第17版的综合测试解决方案
关于FreeRTOS内存分配多少才合适
过程控制系统经历过的三个发展阶段
70年人工智能研究,解读研究者最大的惨痛教训经验
CASAIM广州中大型工件形位公差三维扫描尺寸三维测量解决方案