我制作了一个非常基本的情节。我有一个csv数据集,如下所示:
1,280.6
2,280.2
3,276.6
4,279.6
5,277.4
6,279.4
7,274.2
8,278.2
9,276.4
10,279.4
11,274.6
12,276.2
13,274.4
14,277.8
我正在用这样的matplotlib绘图:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('dataset.csv', delimiter=',',header=None,names=['x','y'])
plt.plot(df['x'], df['y'], label='',color=current_palette)
plt.xlabel('x')
plt.ylabel('y')
plt.title('Title')
plt.show()
给出了这个: a pretty graph
根据我的知识和之前在这里找到的答案,我知道在绘制给定方程或范围或类似时,如何计算最佳拟合线。但是,找到最适合给定数据集的最佳方法是什么?
非常感谢!
答案 0 :(得分:0)
为了找到最合适的线条,我建议使用scipy的linear regression module。
from scipy import stats.linregress
slope, intercept, r_value, p_value, std_err = stats.linregress(df['x'], df['y'])
现在你有斜率和截距,你可以绘制最佳拟合线。