我有一个数据框df1
,列A
的每一行都包含一个数字列表,如下所示:
import pandas as pd
dic = {'A':[[0,2,5,464,64789,131,13],[1,454,45166,78],[6,8],[1],[7,8789,45,65]]}
df1 = pd.DataFrame(dic)
我的目标是将每行保存在.txt文件中,以便为每行显示列表的内容。到目前为止,我可以通过使用以下代码行来实现它:
df1.to_csv('../ndb/_fede.txt',index=False, header=None)
但是输出文件有一些我不需要的引号和括号。
# What I get | # What I WANT!
"[0, 2, 5, 464, 64789, 131, 13]" | 0,2,5,464,64789,131,13
"[1, 454, 45166, 78]" | 1,454,45166,78
"[6, 8]" | 6,8
"[1]" | 1
"[7, 8789, 45, 65]" | 7,8789,45,65
基本上我想要的是每个列表的所有数字都用逗号分隔,而不是其他字符。
注意:如果需要,您还可以将df1
转换为数组。
答案 0 :(得分:2)
将更简单的解决方案转换为str
并按split
删除[]
:
df1.A = df1.A.astype(str).str.strip('[]')
print (df1)
A
0 0, 2, 5, 464, 64789, 131, 13
1 1, 454, 45166, 78
2 6, 8
3 1
4 7, 8789, 45, 65
如果需要删除空格:
df1.A = df1.A.astype(str).str.strip('[]').str.replace('\s+', '')
print (df1)
A
0 0,2,5,464,64789,131,13
1 1,454,45166,78
2 6,8
3 1
4 7,8789,45,65
如果只需要保存一列,则最简单的是更改默认分隔符,
,因为分隔符,
和列中的值为,
,因此添加了"
:
print (df1.to_csv(index=False, header=None, sep="|"))
0,2,5,464,64789,131,13
1,454,45166,78
6,8
1
7,8789,45,65
答案 1 :(得分:1)
df1.A.apply(
lambda x: ','.join(pd.Series(x).astype(str))
).to_frame().to_csv('../ndb/_fede.txt', index=False, sep='|')