本文共 409 字,大约阅读时间需要 1 分钟。
A正确。考虑加入正则化项的原因:想象一个完美的数据集,y>1是正类,y<-1是负类,决策面y=0,加入一个y=-30的正类噪声样本,那么决策面将会变“歪”很多,分类间隔变小,泛化能力减小。加入正则项之后,对噪声样本的容错能力增强,前面提到的例子里面,决策面就会没那么“歪”了,使得分类间隔变大,提高了泛化能力。 B正确。 C错误。c错的是前半句 1/||w|| 只是求最大分类间隔的简化形式,l2范数就是向量的模,l1范数是个绝对值之和,l0范数是向量0的个数。 D正确。考虑软间隔的时候,C对优化问题的影响就在于把a的范围从[0,+inf]限制到了[0,C]。C越小,那么a就会越小,目标函数拉格朗日函数导数为0可以求出w=求和a_i*y_i*x_i,a变小使得w变小,因此间隔2/||w||变大
C越大,分类器就竭尽全力地修正,争取少犯错误,拟合数据,容易过拟合。
C越小,分类器不在乎错误。性能就会较差,欠拟合。
转载地址:http://kcwbf.baihongyu.com/