【Python机器学习】SVM——预处理数据-Toy模板网

这篇具有很好参考价值的文章主要介绍了【Python机器学习】SVM——预处理数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

为了解决特征特征数量级差异过大，导致的模型过拟合问题，有一种方法就是对每个特征进行缩放，使其大致处于同一范围。核SVM常用的缩放方法是将所有的特征缩放到0和1之间。

“人工”处理方法：


import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
cancer=load_breast_cancer()
X_train,X_test,y_train,y_test=train_test_split(cancer.data,cancer.target,random_state=0)

#计算训练集中每个特征的最小值
min_on_train=X_train.min(axis=0)
#计算训练集中每个特征的范围（最小值-最大值）
range_on_train=(X_train-min_on_train).max(axis=0)
#减去最小值，然后除以范围，这样最大值都是1，最小值都是0
X_train_scales=(X_train-min_on_train)/range_on_train

print('每个特征的最小值:{}'.format(X_train_scales.min(axis=0)))
print('每个特征的最大值:{}'.format(X_train_scales.max(axis=0)))

X_test_scales=(X_test-min_on_train)/range_on_train

svc=SVC(C=1,gamma=1)
svc.fit(X_train_scales,y_train)
print('训练集精度：{:.3f}'.format(svc.score(X_train_scales,y_train)))
print('测试集精度：{:.3f}'.format(svc.score(X_test_scales,y_test)))

【Python机器学习】SVM——预处理数据,Python机器学习,机器学习,python,支持向量机,svm,人工智能