Question

我有一个数据框df1，列A的每一行都包含一个数字列表，如下所示：

import pandas as pd
dic = {'A':[[0,2,5,464,64789,131,13],[1,454,45166,78],[6,8],[1],[7,8789,45,65]]}
df1 = pd.DataFrame(dic)

我的目标是将每行保存在.txt文件中，以便为每行显示列表的内容。到目前为止，我可以通过使用以下代码行来实现它：

df1.to_csv('../ndb/_fede.txt',index=False, header=None)

但是输出文件有一些我不需要的引号和括号。

# What I get                       | # What I WANT!
"[0, 2, 5, 464, 64789, 131, 13]"   | 0,2,5,464,64789,131,13
"[1, 454, 45166, 78]"              | 1,454,45166,78
"[6, 8]"                           | 6,8
"[1]"                              | 1
"[7, 8789, 45, 65]"                | 7,8789,45,65

基本上我想要的是每个列表的所有数字都用逗号分隔，而不是其他字符。

注意：如果需要，您还可以将df1转换为数组。

Answer 1

将更简单的解决方案转换为str并按split删除[]：

df1.A = df1.A.astype(str).str.strip('[]')
print (df1)
                              A
0  0, 2, 5, 464, 64789, 131, 13
1             1, 454, 45166, 78
2                          6, 8
3                             1
4               7, 8789, 45, 65

如果需要删除空格：

df1.A = df1.A.astype(str).str.strip('[]').str.replace('\s+', '')
print (df1)
                        A
0  0,2,5,464,64789,131,13
1          1,454,45166,78
2                     6,8
3                       1
4            7,8789,45,65

如果只需要保存一列，则最简单的是更改默认分隔符,，因为分隔符,和列中的值为,，因此添加了"：

print (df1.to_csv(index=False, header=None, sep="|"))
0,2,5,464,64789,131,13
1,454,45166,78
6,8
1
7,8789,45,65

Answer 2

df1.A.apply(
    lambda x: ','.join(pd.Series(x).astype(str))
).to_frame().to_csv('../ndb/_fede.txt', index=False, sep='|')

如何使用Pandas保存行内的列表

2 个答案: