![人工智能辅助药物设计](https://wfqqreader-1252317822.image.myqcloud.com/cover/158/50871158/b_50871158.jpg)
3.2 间隔与支持向量
给定训练样本集,分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,划分超平面是指将训练集分隔开来的直线,它将不同类别的样本分开,但能将训练样本分开的划分超平面可能有很多,如图3-1所示。
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00422.jpg?sign=1739327836-UDD9gDgJ5k1qkgtq0MVmJ34OCC2a5gL2-0-3387f684f484a57cd3fdfb6365e824b1)
图3-1 存在多个划分超平面将两类训练样本分开
从图3-1可以看出,位于两类训练样本“正中间”的划分超平面(图3-1中黑色加粗的直线)就是我们要找的划分超平面,因为该划分超平面对训练样本局部扰动的“容忍”性最好。例如,由于训练集的局限性或噪声因素,训练集外的样本可能比图3-1中的训练样本更接近两个类的分隔界,这将使许多划分超平面出现错误,而黑色加粗的超平面受影响最小。换言之,这个划分超平面所产生的分类结果的鲁棒性最好,对未见示例的泛化能力也最强。
对于一个数据点,离超平面越远,其最后的预测结果越可信,因此需要寻找到一些离超平面最近的点,确保它们离超平面的距离尽可能远,这些点到划分超平面的距离称为间隔。离划分超平面最近的那些点称为支持向量,因此寻找划分超平面的问题便转化为寻找最大间隔的问题。
在样本空间中,划分超平面可通过式(3-1)的线性方程来描述,即
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00429.jpg?sign=1739327836-IWoXy7Na8e8uWIfzEHEJEcPL6ldphmmy-0-98ddd0236c43320dec9db31d47c84966)
(3-1)
其中,为法向量,决定了超平面的方向;b为位移项,决定了超平面与原点之间的距离。若将超平面记为
,那么样本空间中任意点x到超平面
的距离可写为
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00450.jpg?sign=1739327836-wbq0xDQHctbDaciDJLH6UIyAQJRwizW5-0-54e43e56f608ba874edc7df952e05e17)
(3-2)
假设超平面能将训练样本正确分类,那么对于
,若
,则有
;若
,则有
。
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00506.jpg?sign=1739327836-KsgEiicFsvHpdU4cPQisf3sRRsF68fps-0-06350d14879ac0abe72b38ddfb7a4088)
(3-3)
如图3-2所示,每个样本点对应一个特征向量,距离超平面最近的这几个训练样本点(支持向量)使式(3-3)的等号成立,两个异类支持向量到超平面的距离之和为
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00514.jpg?sign=1739327836-heDjOGl6d8as2Bt341zYIpfqxgiCxc2H-0-ccc8b410dfa72cf05578a62db5535e01)
(3-4)
它被称为“间隔”(margin)。
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx00515.jpg?sign=1739327836-9gVgJOZ6FnzPRGv7x5D9iHmPqFxadqe8-0-541ddc08806ca68e0810444468664edc)
图3-2 支持向量与间隔
寻找具有“最大间隔”(maximum margin)的划分超平面,就是要找到能满足式(3-3)中约束的参数和
,使得式(3-4)所示的
最大。
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx551.jpg?sign=1739327836-BWZDI5rEH76GVLNC5lIdNQRywn7ypFt0-0-ea848acb77a7444a5f880675e471fcf0)
(3-5)
显然,为了最大化间隔,仅需最大化,这等价于最小化
。于是,式(3-5)可以重写为式(3-6),即
![](https://epubservercos.yuewen.com/68CDDE/29980948803976006/epubprivate/OEBPS/Images/tx565.jpg?sign=1739327836-fY156QCJ7rP4Vv51Ek1BBGzWWQMRmktw-0-cb9c2ca53121b7c489739c6355530f22)
(3-6)
这就是支持向量机的基本型。