所以我试图用python做多变量线性回归。但是我不能这样做,因为我的数据集的大小为(2920x1)。我想像这样2拆分列,但用“;”分隔。 我该怎么做? enter image description here enter image description here
答案 0 :(得分:0)
如果您的pandas.DataFrame的一栏内容如下所示:
>>> import pandas as pd
>>> df = pd.DataFrame({'a;b;c;d': ['2;3;1;6', '0;1;4;2', '6;9;6;0']})
>>> print(df)
a;b;c;d
0 2;3;1;6
1 0;1;4;2
2 6;9;6;0
您本可以使用pandas.Series.str.split()
和pandas.Series.to_list()
来制作新的数据框。
代码如下。
>>> df_adjusted = pd.DataFrame(df.iloc[:, 0].str.split(';').to_list(), columns=df.columns[0].split(';'))
>>> print(df_adjusted)
a b c d
0 2 3 1 6
1 0 1 4 2
2 6 9 6 0
编辑:
要读取以分号分隔单元格的CSV文件,请使用pandas.read_csv()
函数和正确填充的sep
参数。
>>> df = pd.read_csv('path/to/your/data', sep=';')