如何使用pandas获取DataFrame的子集?

时间:2014-05-28 21:34:26

标签: python pandas

我尝试按日期列拆分DataFrame,其中一个DataFrame将是某个日期之前的观察结果,而另一个DataFrame将是那个日期之后的观察结果。

我有一些包含某些列的数据框,其中日期列名为' date_posted'。数据框名为proj。

我尝试使用以下表示法对其进行子集化:

out_1 = proj[proj.date_posted >= '20140101']
out_2 = proj[proj.date_posted < '20140101']

但这似乎不起作用。我也试过使用ix和groupby函数,但我似乎无法工作。是否有一个与R?

中的subset()函数类似的函数

1 个答案:

答案 0 :(得分:0)

这应该有效,所以你可能会遇到“date_posted”问题。柱。它是一个字符串而不是一个int?

如果它已经是一个int尝试:

out_1 = proj[proj['date_posted'] >= 20140101]
out_2 = proj[proj['date_posted'] < 20140101]

如果它真的是一个字符串,请先尝试转换它:

proj['date_posted'] = proj['date_posted'].apply(int)
out_1 = proj[proj['date_posted'] >= 20140101]
out_2 = proj[proj['date_posted'] < 20140101]