Python多元线性回归

时间:2020-04-11 15:37:41

标签: python

所以我试图用python做多变量线性回归。但是我不能这样做,因为我的数据集的大小为(2920x1)。我想像这样2拆分列,但用“;”分隔。 我该怎么做? enter image description here enter image description here

1 个答案:

答案 0 :(得分:0)

如果您的pandas.DataFrame的一栏内容如下所示:

>>> import pandas as pd
>>> df = pd.DataFrame({'a;b;c;d': ['2;3;1;6', '0;1;4;2', '6;9;6;0']})
>>> print(df)
   a;b;c;d
0  2;3;1;6
1  0;1;4;2
2  6;9;6;0

您本可以使用pandas.Series.str.split()pandas.Series.to_list()来制作新的数据框。

代码如下。

>>> df_adjusted = pd.DataFrame(df.iloc[:, 0].str.split(';').to_list(), columns=df.columns[0].split(';'))
>>> print(df_adjusted)
   a  b  c  d
0  2  3  1  6
1  0  1  4  2
2  6  9  6  0

编辑:

要读取以分号分隔单元格的CSV文件,请使用pandas.read_csv()函数和正确填充的sep参数。

>>> df = pd.read_csv('path/to/your/data', sep=';')
相关问题