Question

我在数据框中有一个名为'Year'的列。当我调用时;

filtered_df['Year'].unique()

我的结果是：

阵列（[2013,2012,2014,2015,2016,2017,2011,2010,2009,2008，'2011'， '2010'，'2015'，'2009'，'N 117 ST / GREENWOOD AV N']，dtype = object）

我想将'2011','2010', '2015', and '2009'个实例的结果与非字符串对应的结果结合起来。我认为使用正则表达式可能会这样做，但到目前为止我尝试的唯一事情都返回了错误，这些错误使我相信我的方法本身存在缺陷，所以我没有把它们包含在这里。

有关此问题的计算效率解决方案的任何想法？

Answer 1

通常我们会将其转换为数值（所有不可兑换的值都会按以下方式转换为NaN＆＃39; s）：

filtered_df['Year'] = pd.to_numeric(filtered_df['Year'], errors='coerce')