我尝试按日期列拆分DataFrame,其中一个DataFrame将是某个日期之前的观察结果,而另一个DataFrame将是那个日期之后的观察结果。
我有一些包含某些列的数据框,其中日期列名为' date_posted'。数据框名为proj。
我尝试使用以下表示法对其进行子集化:
out_1 = proj[proj.date_posted >= '20140101']
out_2 = proj[proj.date_posted < '20140101']
但这似乎不起作用。我也试过使用ix和groupby函数,但我似乎无法工作。是否有一个与R?
中的subset()函数类似的函数答案 0 :(得分:0)
这应该有效,所以你可能会遇到“date_posted”问题。柱。它是一个字符串而不是一个int?
如果它已经是一个int尝试:
out_1 = proj[proj['date_posted'] >= 20140101]
out_2 = proj[proj['date_posted'] < 20140101]
如果它真的是一个字符串,请先尝试转换它:
proj['date_posted'] = proj['date_posted'].apply(int)
out_1 = proj[proj['date_posted'] >= 20140101]
out_2 = proj[proj['date_posted'] < 20140101]