如何拆分字符串并指定为熊猫数据框的列名?

时间:2018-07-12 08:40:15

标签: python pandas dataframe series

我有一个数据框,它只有一个这样的列:

  a;d;c;d;e;r;w;e;o
--------------------
0 h;j;r;d;w;f;g;t;r
1 a;f;c;x;d;e;r;t;y
2 b;h;g;t;t;t;y;u;f
3 g;t;u;n;b;v;d;s;e

当我拆分它时,我会变得像这样:

  0  1  2  3  4  5  6  7  8
------------------------------
0 h  j  r  d  w  f  g  t  r
1 a  f  c  x  d  e  r  t  y
2 b  h  g  t  t  t  y  u  f
3 g  t  u  n  b  v  d  s  e

我需要分配a d c d e r w e o而不是0 1 2 3 4 5 6 7 8作为列名。

我尝试过:

df = dataframe
df = df.iloc[:,0].str.split(';')
res = pd.DataFrame(df.columns.tolist())
res = pd.DataFrame(df.values.tolist())

我正在为每个列分配值。但是没有列标题。该怎么办?

1 个答案:

答案 0 :(得分:2)

我认为需要通过DataFrame参数创建新的expand=True,然后分配新的列名称:

res = df.iloc[:,0].str.split(';', expand=True)
res.columns = df.columns[0].split(';')
print (res)
   a  d  c  d  e  r  w  e  o
0  h  j  r  d  w  f  g  t  r
1  a  f  c  x  d  e  r  t  y
2  b  h  g  t  t  t  y  u  f
3  g  t  u  n  b  v  d  s  e

但是如果只有一列数据,可能需要在read_csv中使用sep=';'

res = pd.read_csv(file, sep=';')