在pandas列中组合混合数据类型

时间:2017-11-28 23:38:09

标签: python pandas dataframe

我在数据框中有一个名为'Year'的列。当我调用时;

filtered_df['Year'].unique()

我的结果是:

  

阵列([2013,2012,2014,2015,2016,2017,2011,2010,2009,2008,'2011',          '2010','2015','2009','N 117 ST / GREENWOOD AV N'],dtype = object)

我想将'2011','2010', '2015', and '2009'个实例的结果与非字符串对应的结果结合起来。我认为使用正则表达式可能会这样做,但到目前为止我尝试的唯一事情都返回了错误,这些错误使我相信我的方法本身存在缺陷,所以我没有把它们包含在这里。

有关此问题的计算效率解决方案的任何想法?

1 个答案:

答案 0 :(得分:0)

通常我们会将其转换为数值(所有不可兑换的值都会按以下方式转换为NaN' s):

filtered_df['Year'] = pd.to_numeric(filtered_df['Year'], errors='coerce')