多项式回归图上的多迹

时间:2018-08-07 17:43:26

标签: python matplotlib machine-learning regression

我正在实施简单的多项式回归以根据给定的视频大小预测视频的时间,这是我自己的数据集。现在由于某种原因,我的情节有多条痕迹。

# Importing the libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

# Importing the dataset
dataset = pd.read_csv('estSize.csv')
X = dataset.iloc[:, 0].values.reshape(-1,1)
y = dataset.iloc[:, 1].values.reshape(-1,1)

from sklearn.linear_model import LinearRegression

# Fitting Polynomial Regression to the dataset
from sklearn.preprocessing import PolynomialFeatures
poly_reg = PolynomialFeatures(degree = 2)
X_poly = poly_reg.fit_transform(X)
poly_reg.fit(X_poly, y)
lin_reg_2 = LinearRegression()
lin_reg_2.fit(X_poly, y)

# Visualising the Polynomial Regression results
plt.scatter(X, y, color = 'red')
plt.plot(X, lin_reg_2.predict(poly_reg.fit_transform(X)), color = 'blue')
plt.show()

This is my output

1 个答案:

答案 0 :(得分:3)

您需要根据预测变量对数据进行排序。

行后

dataset = pd.read_csv('estSize.csv')

添加此行:

dataset = dataset.sort_values(by=['col1'])

col1是文件大小值的列标题。