大家好,我正在运行一个代码,该代码需要一个月的分钟数据并将其平均为每小时。代码适用于我的一些文件,但不适用于其他文件。我收到一个非常大的错误,它说“没有要聚合的数字类型”。错误来自df = df.resample('1H')。mean()line。
以下是我正在使用的数据。
https://www.dropbox.com/s/k8c77572an2pk8n/OCTTEST.csv?dl=0
以下是我正在使用的代码。
import pandas as pd
df = pd.read_csv("octtest.csv", index_col="DateTime", parse_dates=True, low_memory=False)
df = df.resample('1H').mean()
df = df.reindex(pd.date_range(df.index.min(), df.index.max(), freq="1H"))
df.to_csv('output.csv', index=True, index_label="DateTime")
答案 0 :(得分:1)
问题NaN
值为Null
,不是参数na_values
的默认值,因此需要添加docs:
df = pd.read_csv("octtest.csv",
index_col="DateTime",
parse_dates=True,
na_values='Null',
keep_default_na=False)