我正在使用的一个软件包具有先决条件,即数据框的索引必须是熊猫DatetimeIndex。因此,我一直试图将数据类型为datetime64 [ns]的列转换为DatetimeIndex,但没有成功。这是我的尝试:
import pandas as pd
my_data = [[1,'2019-05-01 04:00:00'], [2, '2019-05-01 04:01:00'], [3, '2019-05-01 04:02:00']]
test = pd.DataFrame(my_data, columns=['count', 'datetime'])
print(test.dtypes.value_counts())
# Attempt using pd.DateTimeIndex
test['datetime'] = pd.DatetimeIndex(test['datetime'])
print(test.dtypes.value_counts())
if isinstance(test['datetime'], pd.DatetimeIndex):
print('Success')
# Attempt using pd.to_datetime without format string
test['datetime'] = pd.to_datetime(test['datetime'])
print(test.dtypes.value_counts())
if isinstance(test['datetime'], pd.DatetimeIndex):
print('Success')
# Attempt using pd.to_datetime with format string
test['datetime'] = pd.to_datetime(test['datetime'], format='%Y-%m-%d %h:%m:%s')
print(test.dtypes.value_counts())
if isinstance(test['datetime'], pd.DatetimeIndex):
print('Success')
我正在使用最新版本的pandas-0.25.3,并且在python 3.7上使用。任何建设性的建议都将受到赞赏。
答案 0 :(得分:1)
您可以将索引转换为datetime
。在您的列上使用set_index
,然后键入。
import pandas as pd
my_data = [[1,'2019-05-01 04:00:00'], [2, '2019-05-01 04:01:00'], [3, '2019-05-01 04:02:00']]
test = pd.DataFrame(my_data, columns=['count', 'datetime'])
test.set_index('datetime').index.astype('datetime64[ns]')
DatetimeIndex(['2019-05-01 04:00:00', '2019-05-01 04:01:00',
'2019-05-01 04:02:00'],
dtype='datetime64[ns]', name='datetime', freq=None)