如何用熊猫过滤CSV数据文件

时间:2019-10-11 02:14:30

标签: python

我已经将csv文件作为df读取到Python中,并将其保存为名为Master_Clean的新数据框。

csv文件包含有关工作清单的信息。我已经附上了部分csv文件的屏幕截图,因此您可以看到所有列。所有空值均已替换为NaN。

我将如何显示2018年发布的纽约州的职位?我一直遇到麻烦,因为日期以mm / dd / yyyy格式书写,而不仅仅是年份。

以下是列名称:索引(['Job_id','Vertical','Company','Post_date','Fill_date','Time_to_fill','Salary','Location','City','State ','Zip','County','Region_state','Latitude','Longitude'],dtype ='object')

is_NY_2018 = Master_Clean ['State'] =='NY' 打印(is_NY_2018)

1 个答案:

答案 0 :(得分:0)

这里的日期是一个字符串,因此您可以将其拆分为只剩下一年来做您需要做的事情

year = int(Post_date.split("/", 3)[2])

类型转换为int数据类型

您可以遍历Master_Clean['Post_date']以获取Post_date值