我有一个包含20列的数据框,其中两列是Company1和Company2。我想要一个结果数据框,只有那些其中Company1和Company2的长度相差不超过5个字符的行。如何使用pandas完成此任务?
答案 0 :(得分:2)
您可以使用.str.len()
来访问Company
列中的字符数,然后使用矢量化减去pandas系列来计算差异,并创建一个逻辑向量,其中包含子集化条件:< / p>
df[abs(df.Company1.str.len() - df.Company2.str.len()) <= 5]