比较列

时间:2016-10-07 18:15:04

标签: python pandas

我有一个包含20列的数据框,其中两列是Company1和Company2。我想要一个结果数据框,只有那些其中Company1和Company2的长度相差不超过5个字符的行。如何使用pandas完成此任务?

1 个答案:

答案 0 :(得分:2)

您可以使用.str.len()来访问Company列中的字符数,然后使用矢量化减去pandas系列来计算差异,并创建一个逻辑向量,其中包含子集化条件:< / p>

df[abs(df.Company1.str.len() - df.Company2.str.len()) <= 5]