.csv中的切片和编辑日期

时间:2018-09-11 09:59:50

标签: python pandas csv datetime

Python的新手

试图对准备使用熊猫进行比较的数据集进行排序,但是在进行比较之前,我需要编辑某些方面。我的每个日期之前都有一个“ A”需要删除。除此之外,日期本身的格式为YYYYDDD,需要将其更改为DD / MM / YYYY或将我的其他数据集更改为YYYYDDD,以最简单的一个为准。

我尝试删除“ A”的方法如下,除了可能使用“ datetime”库外,我不知道从修改日期开始。

import pandas as pd
import datetime

csv = '/home/student/Desktop/Ben_Folder/AirQuality/Test/2002_DDV.csv'

df = pd.read_csv(csv)
test = df(columns='Date'[1:7])

test.to_csv('Test.csv', header=['Date', 'AOD'])

数据集示例如下:

       Date  AOT
0  A2002185  0.0
1  A2002185  0.0
2  A2002185  0.0
3  A2002185  0.0
4  A2002185  0.0

1 个答案:

答案 0 :(得分:0)

熊猫的日期是stored as integers。您看到的所有 else 都只是这些整数的字符串表示形式。一旦意识到这一点,您将欣赏转换为datetime对象的好处。

在这里您可以使用pd.to_datetime,它允许您指定格式:

df['Date'] = pd.to_datetime(df['Date'], format='A%Y%j')

print(df)

        Date  AOT
0 2002-07-04  0.0
1 2002-07-04  0.0
2 2002-07-04  0.0
3 2002-07-04  0.0
4 2002-07-04  0.0

Python's strftime directives是构建自定义字符串格式的有用资源。