尝试使用df.resample时,Python错误“没有要聚合的数字类型”

时间:2017-03-20 13:32:47

标签: python python-3.x pandas dataframe

大家好,我正在运行一个代码,该代码需要一个月的分钟数据并将其平均为每小时。代码适用于我的一些文件,但不适用于其他文件。我收到一个非常大的错误,它说“没有要聚合的数字类型”。错误来自df = df.resample('1H')。mean()line。

以下是我正在使用的数据。

https://www.dropbox.com/s/k8c77572an2pk8n/OCTTEST.csv?dl=0

以下是我正在使用的代码。

import pandas as pd

df = pd.read_csv("octtest.csv", index_col="DateTime", parse_dates=True, low_memory=False)
df = df.resample('1H').mean()
df = df.reindex(pd.date_range(df.index.min(), df.index.max(), freq="1H"))
df.to_csv('output.csv', index=True, index_label="DateTime")

1 个答案:

答案 0 :(得分:1)

问题NaN值为Null,不是参数na_values的默认值,因此需要添加docs

df = pd.read_csv("octtest.csv", 
                  index_col="DateTime", 
                  parse_dates=True,
                  na_values='Null', 
                  keep_default_na=False)