鸢尾花分类和对SVM的理解 思路:先导入必要的包,准备数据集,将150个样本4个特征组成的矩阵赋值给变量x。将150个样本1个预测目标值组成的矩阵赋值给变量y在x中我们取前两列作为特征, 为了后面的可视化。x[:,0:4]代表第一维(行)全取,第二维(列)取0~2,将测试样本占比设为30%。 搭建模型:将svm.SVC的惩罚系数c设为0.5,将线性核设为高斯核, 我们通过特征映射,将一个二维的线性不可分数据集成功映射到了三维空间的线性可分数据集。然后进行模型训练:训练集特征向量训练集目标值和特征向量。再进行分 别打印训练集和测试集的准确率原始结果与预测结果进行对比计算决策函数的值,表示x到各分割平面的距离。然后进行模型的使用将分好的鸢尾花类给画出来。
对svm的理解:对于二维空间(指数据集有两个特征),对应的超平面就是一条直线;对于三维空间(指数据集拥有三个特征),对应的超平面就是一个平面。可以依次类 推到n维空间SVM的目标就是找到这样的一个超平面(对于上图来说,就是找到一条直线),使得不同类别的数据能够落在超平面的两侧。在线性不可分的情况下的另一种 处理方式是使用核函数,其基本思想是:将原本的低维特征空间映射到一个更高维的特征空间,从而使得数据集线性可分。