我在数据框中有一个名为'Year'的列。当我调用时;
filtered_df['Year'].unique()
我的结果是:
阵列([2013,2012,2014,2015,2016,2017,2011,2010,2009,2008,'2011', '2010','2015','2009','N 117 ST / GREENWOOD AV N'],dtype = object)
我想将'2011','2010', '2015', and '2009'
个实例的结果与非字符串对应的结果结合起来。我认为使用正则表达式可能会这样做,但到目前为止我尝试的唯一事情都返回了错误,这些错误使我相信我的方法本身存在缺陷,所以我没有把它们包含在这里。
有关此问题的计算效率解决方案的任何想法?
答案 0 :(得分:0)
通常我们会将其转换为数值(所有不可兑换的值都会按以下方式转换为NaN
' s):
filtered_df['Year'] = pd.to_numeric(filtered_df['Year'], errors='coerce')