分隔/拆分行值并形成单个行

时间:2018-06-14 12:56:57

标签: python delimiter reshape

可重现的数据代码:

import pandas as pd
dict = {"a": "[1,2,3,4]", "b": "[1,2,3,4]"}
dict = pd.DataFrame(list(dict.items()))

dict

    0   1
 0  a   [1,2,3,4]
 1  b   [1,2,3,4]

我想拆分/分隔“第1列”并为每个拆分值创建单独的行。

预期产出:

     0    1
  0  a    1
  1  a    2
  2  a    3
  3  a    4
  4  b    1
  5  b    2
  6  b    3
  7  b    4

我应该首先删除括号然后拆分值吗?我真的不知道这样做。有什么参考可以帮我解决这个问题吗?

2 个答案:

答案 0 :(得分:2)

基于that answer的逻辑:

s = d[1]\
    .apply(lambda x: pd.Series(eval(x)))\
    .stack()

s.index = s.index.droplevel(-1)
s.name = "split"
d.join(s).drop(1, axis=1)

答案 1 :(得分:1)

由于您的单元格中包含包含列表(而非列表)的字符串,因此您可以使用eval

dict_v = {"a": "[1,2,3,4]", "b": "[1,2,3,4]"}
df = pd.DataFrame(list(dict_v.items()))
df = (df.rename(columns={0:'l'}).set_index('l')[1]
          .apply(lambda x: pd.Series(eval(x))).stack()
           .reset_index().drop('level_1',1).rename(columns={'l':0,0:1}))

或其他方式可能是创建DataFrame(可能更快),例如:

df = (pd.DataFrame(df[1].apply(eval).tolist(),index=df[0])
          .stack().reset_index(level=1, drop=True)
            .reset_index(name='1'))

您的输出是

   0  1
0  a  1
1  a  2
2  a  3
3  a  4
4  b  1
5  b  2
6  b  3
7  b  4

所有重命名都是准确输入/输出