我有一个跟踪职业高尔夫统计数据的数据集,其中包含1500多个列。许多功能以英尺和英寸(例如6'2“)存储,python将字符串当作字符串存储。由于列数太多,我无法列出包含英尺和英寸度量值的每一列的名称。想要找到同时包含'&“的所有列。然后,我将能够使用必须将英尺和英寸的尺寸转换为英寸的代码。这是我尝试过的一些代码的示例。
df1 = df.ix[:,df.gt('"').any()]
谢谢!
答案 0 :(得分:2)
一种方法是将str.contains
与起始DataFrame上的正则表达式一起使用,然后.any()
生成布尔值。
cols = df.apply(lambda x: x.str.contains('\'|"')).any().index
df1 = df[cols].copy()
这可能不是最快(或最优雅)的解决方案,但我希望您的桌子足够小,不要紧!