熊猫创建列列表,其中行值包含'&“分隔符

时间:2019-05-25 19:43:59

标签: python pandas dataframe

我有一个跟踪职业高尔夫统计数据的数据集,其中包含1500多个列。许多功能以英尺和英寸(例如6'2“)存储,python将字符串当作字符串存储。由于列数太多,我无法列出包含英尺和英寸度量值的每一列的名称。想要找到同时包含'&“的所有列。然后,我将能够使用必须将英尺和英寸的尺寸转换为英寸的代码。这是我尝试过的一些代码的示例。

df1 = df.ix[:,df.gt('"').any()]

谢谢!

1 个答案:

答案 0 :(得分:2)

一种方法是将str.contains与起始DataFrame上的正则表达式一起使用,然后.any()生成布尔值。

cols = df.apply(lambda x: x.str.contains('\'|"')).any().index
df1 = df[cols].copy()

这可能不是最快(或最优雅)的解决方案,但我希望您的桌子足够小,不要紧!