我已经将我的year列正确地转换为datetime索引,但是月份和日期不准确并且不需要,因为我的数据集仅包含year。我仅使用格式参数设置年份,但是仍显示为“%Y-%M-%D”格式。
原始数据:
index song year artist genre
0 0 ego-remix 2009 beyonce knowles Pop
1 1 shes-tell-me 2009 save Rock
2 2 hello 2009 yta Pop
3 3 the rock 2009 term R&B
4 4 black-culture 2009 hughey Country
使用以上代码进行了更多的清理技术。
这是我的数据框代码中的示例行:
clean_df.index = pd.to_datetime(clean_df['year'], format='%Y')
clean_df = clean_df.drop(['index', 'year'], 1)
clean_df.sort_index(inplace=True)
clean_df.head()
year song artist genre
1970-01-01 hey now caravan Rock
1970-01-01 show me abc Rock
1970-01-01 hey now xyz Pop
1970-01-01 tell me foxy R&B
1970-01-01 move up curtis R&B
还有其他方法可以将索引设置为仅年度索引吗?
答案 0 :(得分:0)
你很亲密
clean_df.index = pd.to_datetime(clean_df['year'], format='%Y-%m-%d').year
由于我没有您的原始数据,因此很难提供所需的实际正确格式,但是您只需要转换为日期对象,然后调用year
参数