支持向量机寻找最优分类超平面的优化问题

根据,在线性可分情况下,支持向量机寻找最优分类超平面的优化问题可以表示为:
最小化:1/2||ω||2,
限制条件:yi(ωtxi+b)≥1,i=1~n。
求解上述最优化问题,可得出一组ω和b的值,使得ωtx+b=0所表示的超平面为最优分类超平面。
但在训练样本是线性不可分的情况下,上述最优化问题不存在合适的解(个人理解:不存在合适的解的原因是上述最优化问题的本质是求解最优分类超平面,最优分类超平面应满足可将训练数据完全分为两类的条件,但在训练样本是线性不可分的情况,不存在满足上述条件的超平面)。
因此,寻找线性不可分的训练样本的最优超平面时,需将上述优化问题的限制条件放松。放松限制条件的方式是引入松弛变量δi(slack variable),将上述优化问题的限制条件改写为:
yi(ωtxi+b)≥1-δi,i=1~n
在线性不可分的情况下,训练样本的数据无法满足均yi(ωtxi+b)≥1,但可通过调整δi的值使所有训练数据均满足yi(ωtxi+b)≥1-δi。同时,为使分类的准确性尽可能高,δi的值也需被限定。
根据上述思路,在线性不可分的情况下,支持向量机寻找最优分类超平面的优化问题可以表示为:
最小化:1/2||ω||2+c∑δi或1/2||ω||2+c∑δi2,
限制条件:(1)δi≥0,i=1~n;(2)yi(ωtxi+b)≥1-δi,i=1~n。
其中,最小化1/2||ω||2+c∑δi或1/2||ω||2+c∑δi2使δi的取值尽可能小,c为比例因子,c的值需人为设定。算法中需人为设定的参数被称为算法的超参数(hyper parameter)。
在实际应用中,开发人员会不断被变化超参数值,并测试各种超参数算法的识别率,以选取使算法识别率达至最高的超参数值。
如果一个算法的超参数越多,该算法需手动调整的部分越多,其自动性越低,支持向量机是超参数较少的算法模型,超参数较多的算法模型包括:人工神经网络、卷积神经网络(根据百度百科:卷积神经网络是深度学习的代表算法之一)等。
尽管在线性不可分的情况下,机器学习可以通过使1/2||ω||2+c∑δi或1/2||ω||2+c∑δi2最小化寻找最优分类超平面,但该方法的分类准确率不一定较高。
如图一所示,图一中的直线为机器学习通过支持向量机寻找最优分类超平面,但该直线对图一中圆圈和叉的分类的准确率与随机猜测的准确率差异不大。
图一,图片来源:中国慕课大学《机器学习概论》
此情况出现的原因是通过使1/2||ω||2+c∑δi或1/2||ω||2+c∑δi2最小化寻找最优分类超平面的算法模型是线性的,即假设算法模型的分类函数是线性的。因此,该算法模型对分类函数为非线性函数的训练样本进行分类时,将出现分类错误的情况。
当训练样本的非线性分类函数与线性函数差异较大时,分类错误的情况出现的概率将较大,可能出现分类的准确率与随机猜测的准确率差异不大的情况。


伊朗发布最新“国产航母”,具备多架无人机弹射装置
移位寄存器74ls194_74ls194逻辑功能表
微软将向美国陆军提供用于战斗任务和士兵训练的AR系统原型
新闻 | 华为CloudEngine 16800系列交换机入选十大最具影响力新技术新产品
5G技术研发试验第三阶段测试结果发布 主要功能符合预期已达到预商用水平
支持向量机寻找最优分类超平面的优化问题
怎么理解电容的直流偏压特性?
磁元件企业进入碳中和50强企业的供应商名单
我国通信发展史上的重要阶段回顾与总结分析
京东方蝉联BrandZ最具价值中国品牌排行榜TOP100
未来几年语音和语音识别市场将增至69亿美元
微控制器 PWM 如何输出更高效地驱动负载
中控智慧科技指纹门禁一体机smart3F介绍
压力感测技术以及电容触控芯片于对智能手机发展作用
利用DLP Pico技术打造卓越的智能显示体验
单片机如何增大电流?电流大小与什么有关?
工字型电感感值不合格的原因分析
阿丘助力攻克动力电池复杂瑕疵检测难题
马克思发生器电路图及制作教程
软磁铁氧体磁心的直流叠加特性