机器学习算法之六:5分钟上手Logistic Regression

时间:2022-11-04 05:44:22

1.案例:这个数据用针对房屋售价的结果。如下CSV档(6.Logistic_Regression.csv),两个栏位各代表面积与售价。

2.问题:现在有一面积为700,请问预估可能的售价是多少?

3.数据文档:6.Logistic_Regression.csv,内容如下。

square_feet price
150 6450
200 7450
250 8450
300 9450
350 11450
400 15450
600 18450

4.Sampe code:

#encoding: utf-8

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import linear_model

#----取得输入资料
def get_data(file_name):
	data = pd.read_csv(file_name)
	X_parameter = []
	Y_parameter = []
	for single_square_feet ,single_price_value in zip(data['square_feet'],data['price']):
		X_parameter.append([float(single_square_feet)])
		Y_parameter.append(float(single_price_value))
	return X_parameter,Y_parameter

#----设定回归分析的函数与设定值
def linear_model_main(X_parameters,Y_parameters,predict_value):
	regr = linear_model.LinearRegression()
	regr.fit(X_parameters, Y_parameters)
	predict_outcome = regr.predict(predict_value)
	predictions = {}
	predictions['intercept'] = regr.intercept_
	predictions['coefficient'] = regr.coef_
	predictions['predicted_value'] = predict_outcome
	return predictions

#----取得资料
X,Y = get_data("6.Logistic_Regression.csv")

#----设定输入值(面积)
predictvalue = 700

#----输出预测值
result = linear_model_main(X,Y,predictvalue)
print u"预测的价格为: ", result['predicted_value']

5.结果:

预测的价格为:  [ 21915.42553191]