Python的新手
试图对准备使用熊猫进行比较的数据集进行排序,但是在进行比较之前,我需要编辑某些方面。我的每个日期之前都有一个“ A”需要删除。除此之外,日期本身的格式为YYYYDDD,需要将其更改为DD / MM / YYYY或将我的其他数据集更改为YYYYDDD,以最简单的一个为准。
我尝试删除“ A”的方法如下,除了可能使用“ datetime”库外,我不知道从修改日期开始。
import pandas as pd
import datetime
csv = '/home/student/Desktop/Ben_Folder/AirQuality/Test/2002_DDV.csv'
df = pd.read_csv(csv)
test = df(columns='Date'[1:7])
test.to_csv('Test.csv', header=['Date', 'AOD'])
数据集示例如下:
Date AOT
0 A2002185 0.0
1 A2002185 0.0
2 A2002185 0.0
3 A2002185 0.0
4 A2002185 0.0
答案 0 :(得分:0)
熊猫的日期是stored as integers。您看到的所有 else 都只是这些整数的字符串表示形式。一旦意识到这一点,您将欣赏转换为datetime
对象的好处。
在这里您可以使用pd.to_datetime
,它允许您指定格式:
df['Date'] = pd.to_datetime(df['Date'], format='A%Y%j')
print(df)
Date AOT
0 2002-07-04 0.0
1 2002-07-04 0.0
2 2002-07-04 0.0
3 2002-07-04 0.0
4 2002-07-04 0.0
Python's strftime
directives是构建自定义字符串格式的有用资源。