如何使用Pandas保存行内的列表

时间:2017-02-02 08:46:27

标签: python csv pandas dataframe save

我有一个数据框df1,列A的每一行都包含一个数字列表,如下所示:

import pandas as pd
dic = {'A':[[0,2,5,464,64789,131,13],[1,454,45166,78],[6,8],[1],[7,8789,45,65]]}
df1 = pd.DataFrame(dic)

我的目标是将每行保存在.txt文件中,以便为每行显示列表的内容。到目前为止,我可以通过使用以下代码行来实现它:

df1.to_csv('../ndb/_fede.txt',index=False, header=None)

但是输出文件有一些我不需要的引号和括号。

# What I get                       | # What I WANT!
"[0, 2, 5, 464, 64789, 131, 13]"   | 0,2,5,464,64789,131,13
"[1, 454, 45166, 78]"              | 1,454,45166,78
"[6, 8]"                           | 6,8
"[1]"                              | 1
"[7, 8789, 45, 65]"                | 7,8789,45,65

基本上我想要的是每个列表的所有数字都用逗号分隔,而不是其他字符。

注意:如果需要,您还可以将df1转换为数组。

2 个答案:

答案 0 :(得分:2)

将更简单的解决方案转换为str并按split删除[]

df1.A = df1.A.astype(str).str.strip('[]')
print (df1)
                              A
0  0, 2, 5, 464, 64789, 131, 13
1             1, 454, 45166, 78
2                          6, 8
3                             1
4               7, 8789, 45, 65

如果需要删除空格:

df1.A = df1.A.astype(str).str.strip('[]').str.replace('\s+', '')
print (df1)
                        A
0  0,2,5,464,64789,131,13
1          1,454,45166,78
2                     6,8
3                       1
4            7,8789,45,65

如果只需要保存一列,则最简单的是更改默认分隔符,,因为分隔符,和列中的值为,,因此添加了"

print (df1.to_csv(index=False, header=None, sep="|"))
0,2,5,464,64789,131,13
1,454,45166,78
6,8
1
7,8789,45,65

答案 1 :(得分:1)

df1.A.apply(
    lambda x: ','.join(pd.Series(x).astype(str))
).to_frame().to_csv('../ndb/_fede.txt', index=False, sep='|')