机器学习算法之五:5分钟上手Linear Regression

时间:2023-01-05 05:46:20

1.案例:承袭KNN,这个数据依旧是用打斗次数和接吻次数来界定电影类型,接吻多的是Romance类型的,而打斗多的是动作电影。

2.问题:现在有二部名字未知的电影,第一部打斗次数为3次,接吻次数为103次,第二部打斗次数为102次,接吻次数为5次,请问它们分别属于哪种类型的电影呢?

3.Sampe code:

# -*- coding: utf-8 -*-
import numpy as np
from sklearn import linear_model
clf = linear_model.LinearRegression()
from sklearn.externals import joblib

#data对应着打斗次数,接吻次数
data = np.array([[3,104],[2,100],[1,81],[101,10],[99,5],[98,2]])
#labels则是对应爱情片(以1代替)和动作片(以2代替)
labels = np.array([1,1,1,2,2,2])

#训练
clf.fit(data, labels)

#进行预测测试
test_data=np.array([[3,103], [102,5]])
print clf.predict(test_data)

#储存模型
joblib.dump(clf, "5.Linear_Regression_model.m")

#导入已储存的模型进行预测
clf1 = joblib.load("5.Linear_Regression_model.m")
print clf1.predict(test_data)

4.结果:

[ 1.00098488  2.0254356 ]
[ 1.00098488  2.0254356 ]