在Python中使用支持向量机(SVM)进行分类,你可以遵循以下步骤:
导入必要的库
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
准备数据
你可以使用内置的数据集,例如鸢尾花数据集,或者加载自定义的数据集。
使用内置的鸢尾花数据集
iris = datasets.load_iris()
X = iris.data[:, :2] 只使用前两个特征
y = iris.target 假设我们只关注前两个类别的数据
划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
创建支持向量机模型
你可以指定不同的核函数,例如线性核、多项式核、径向基核(RBF)等。
创建一个线性核的支持向量机模型
model = SVC(kernel='linear', C=1)
拟合模型
使用训练数据来训练模型。
model.fit(X_train, y_train)
预测新数据
使用训练好的模型来预测新数据点的类别。
new_data = [[2.0, 2.0]]
print(model.predict(new_data))
评估模型(可选):
你可以使用测试集来评估模型的性能。
from sklearn.metrics import accuracy_score
y_pred = model.predict(X_test)
print(accuracy_score(y_test, y_pred))
以上步骤展示了如何在Python中使用scikit-learn库实现支持向量机算法的基本流程。你可以根据具体的数据集和需求调整参数和设置。