一:vgg介绍与模型结构
vgg全称是visual geometry group属于牛津大学科学工程系,其发布了一些列以vgg开头的卷积网络模型,可以应用在人脸识别、图像分类等方面,分别从vgg16~vgg19。vgg研究卷积网络深度的初衷是想搞清楚卷积网络深度是如何影响大规模图像分类与识别的精度和准确率的,最初是vgg-16号称非常深的卷积网络全称为(gg-very-deep-16 cnn),vgg在加深网络层数同时为了避免参数过多,在所有层都采用3x3的小卷积核,卷积层步长被设置为1。vgg的输入被设置为224x244大小的rgb图像,在训练集图像上对所有图像计算rgb均值,然后把图像作为输入传入vgg卷积网络,使用3x3或者1x1的filter,卷积步长被固定1。vgg全连接层有3层,根据卷积层+全连接层总数目的不同可以从vgg11 ~ vgg19,最少的vgg11有8个卷积层与3个全连接层,最多的vgg19有16个卷积层+3个全连接层,此外vgg网络并不是在每个卷积层后面跟上一个池化层,还是总数5个池化层,分布在不同的卷积层之下,下图是vgg11 ~gvv19的结构图:
考虑到整个网络的精简结构显示,relu激活函数并没有被显示在上述结构中。上述结构中一些说明:
conv表示卷积层
fc表示全连接层
conv3表示卷积层使用3x3 filters
conv3-64表示 深度64
maxpool表示最大池化
上述vgg11 ~ vgg19参数总数列表如下:
在实际处理中还可以对第一个全连接层改为7x7的卷积网络,后面两个全连接层改为1x1的卷积网络,这个整个vgg就变成一个全卷积网络fcn。在vgg网络之前,卷积神经网络cnn很少有突破10层的,vgg在加深cnn网络深度方面首先做出了贡献,但是vgg也有自身的局限性,不能无限制的加深网络,在网络加深到一定层数之后就会出现训练效果褪化、梯度消逝或者梯度爆炸等问题,总的来说vgg在刚提出的时候也是风靡一时,在imagenet竞赛数据集上都取得了不错的效果
在其他类似数据上同样表现不俗:
二:预训练模型使用(caffe)
vgg本身提供了预训练模型供大家可以自由使用,预训练的vgg-16模型与vgg-19模型下载地址可以在这里发现:
http://www.robots.ox.ac.uk/~vgg/research/very_deep/
下载vgg-16模型之后使用opencv dnn模块相关api,就可以实现一个图像分类器,支持1000种图像分类,基于imagenet 2014-ilsvrc数据集训练。原图:
vgg-16预测分类结果:
稍微有点尴尬的是,opencl初始化内存不够了,只能说我的机器不给力:
演示网络加载与图像分类的opencv程序代码如下:
LG开发出业界首款2K 480Hz OLED面板
高速缓存(Cache),高速缓存(Cache)原理是什么?
基于短距离无线通信技术传输信息的文字信息编辑控制器
半导体行业的「反潮流」,人工智能正在给半导体行业带来新的变革机遇
谈谈晶体管的频率参数,Transistor frequency parameter
VGG介绍卷积神经网络的模型结构
dfrobotESP-EYE 智能摄像头开发板简介
手把手教你通过CODESYS V3进行PLC编程(一)
浅谈STM32CubeMX的理解心得与运用
告别传统清洁模式,扫地机什么牌子好
单片机io口输入电压是多少
MTK8788安卓核心板
SOLIDWORKS 2023新增功能介绍
无线网,无线通信技术是什么意思
农业大中型灌区灌溉用水节水计量监测设备 机井灌溉控制器 遥测终端机RTU
显示控制器块的显着特征
XKCON祥控港口码头斗轮机无人值守智能控制系统
vr消防产品优势的介绍,VR消防体验流程简介
美国移动运营商Verizon宣布将暂停拓展5G商用服务
伺服驱动器怎么设置_伺服驱动器参数设置步骤(KNDSD100详解)