ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

西瓜书笔记-支持向量机-1

2019-11-10 14:02:15  阅读:369  来源: 互联网

标签:西瓜 间隔 样本 笔记 划分 超平面 向量 式子


ω支持向量机简介

  支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane)(百度百科)

间隔和支持向量

  因为分类学习的基本想法就是在训练集D{(x1,y1),(x2,y2),...,(xm,ym)}的样本空间中找到一个划分超平面将不同类别的样本分开。因此我们的目的就是在众多划分超平面中找到一个最好的划分平面(如下图)。

 图1:存在多个划分超平面将两类训练样本分开

 

从上图可以看出红色的划分超平面应该是效果最好的,因为该划分超平面对样本局部扰动的“容忍”性最好。因为由于训练集的局限性或噪声的因素,训练集之外的样本可能更加接近两个类的分隔界,这就会使得许多的划分超平面出现错误,而红色的超平面影响最小,也就是说这个划分超平面所产生的分类结果是最“鲁棒”的,泛化能力最强的。

鲁棒性(Robust):强壮和健壮的意思,在这里是指训练后的模型对异常数据进行分类仍然能够得到较好的结果

泛化能力:学得模型适用于没在训练集中出现的样本的新样本的能力,称为泛化能力

 

在样本空间中,划分超平面可以用如下线性方程来描述: ωTx + b = 0

其中ω=(ω1,ω2....ωd为法向量,决定了超平面的方向;b为位移项,决定了原点和超平面的距离,因此划分超平面可被法向量ω和位移b确定

例如在三维平面中,平面方程可以表示为:Ax+By+Cz+D=0 因此平面的法向量为(A,B,C),原点到平面的距离为D,点到平面的距离推导如下图

 

 

 

因此,样本空间中任意一点到超平面(ω,b)的距离为:

 

 

假设超平面能够将训练样本正确分类,即对于(xi,yi)∈D ,如果yi = +1 , ωTx + b>0,如果yi = -1 , ωTx + b<0 。

同时,因为对超平面进行缩放,总能得到下面的式子:

支持向量:如下图所示的,有部分点恰好使得上面的式子的等号成立,这些点就被称为支持向量。

 

 

 

 

 

间隔:两个异类支持向量之和到超平面的距离γ就被称为间隔。

                                                          

 

 支持向量分类就是为了找到具有“最大间隔”的划分超平面,也就是说找到约束中的ω和b使得间隔γ最大,因此可以得到如下式子:

间隔从式子中看只与ω有关,但是b在约束中也会影响ω的值。

 

上面的式子可以重写为如下式子,这就是支持向量机的基本型。

 

                          

 

 

 

 对偶问题

 

 

 

 

 

 

 

 

                                                                                                       

 

 

 

 

标签:西瓜,间隔,样本,笔记,划分,超平面,向量,式子
来源: https://www.cnblogs.com/lovejjy/p/11812141.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有