pandas保留包含多个分隔符的行

时间:2017-05-10 19:31:05

标签: python pandas

一个文本文件,其中有多列用于represntation,只显示2列,5行原始df有~400,000行

col0 col1 
A1   info
A2   info1,info2
A3   info4,info1,info6
A4   info3,info10
A5   info7,info1,info2,info4,info9

我想要做的是有一行,其中col1有多个元素保留第一个元素并删除剩余的元素预期输出

col0 col1 
A1   info
A2   info1
A3   info4
A4   info3
A5   info7

进行完整性检查是否可以输出在单独的文本文件中修改的行? 例子

file_with_rows_modified.txt将有

col0 col1
A2   info1,info2
A3   info4,info1,info6
A4   info3,info10
A5   info7,info1,info2,info4,info9

编辑:这些是扁平字符串

1 个答案:

答案 0 :(得分:3)

你需要

df.col1 = df.col1.str.split(',').str[0]


    col0    col1
0   A1      info
1   A2      info1
2   A3      info4
3   A4      info3
4   A5      info7

关于第二个问题,

df[df.col1.str.split(',').str.len() >1]

将返回需要编辑的所有行,以便在修改数据帧之前将结果保存到另一个df中