我有一个数据框,每5分钟读取一次原始仪表。该文件为CSV文件格式。
这是我数据框的一部分(它也包含缺失值)
DateTime;ActivePower
01.11.2018,00:00:00;13731302000
01.11.2018,00:05:00;13731358000
01.11.2018,00:10:00;13731418000
01.11.2018,00:15:00;13731476000
01.11.2018,00:20:00;13731530000
01.11.2018,00:25:00;13731588000
01.11.2018,00:30:00;13731646000
01.11.2018,00:35:00;13731702000
01.11.2018,00:40:00;13731758000
01.11.2018,00:45:00;13731814000
01.11.2018,00:50:00;13731866000
01.11.2018,00:55:00;13731920000
01.11.2018,01:00:00;13731978000
01.11.2018,01:05:00;13732034000
01.11.2018,01:10:00;13732090000
01.11.2018,01:15:00;13732144000
01.11.2018,01:20:00;13732196000
01.11.2018,01:25:00;13732250000
01.11.2018,01:30:00;13732304000
我想要每15分钟时间戳的平均值/中位数/标准差/最小值/最大值,并将其绘制为曲线。
R可以吗?
我已经尝试了各种功能。
最初我能够将数据削减15分钟,但是该代码不再运行。
aggregate()
并没有帮助我,因为我不想汇总。
我正在学习R,但是无法为此找到任何解决方案。我真的陷入了困境,需要一个解决方案,这样我才能继续。
在此之后,我还将需要对这些结果进行聚类。因此,如果有人可以提供帮助,那将是一个很大的帮助。 预先谢谢你。
答案 0 :(得分:1)
如何?
library(dplyr)
summarised_data <- your_data_here %>%
group_by(quater_hr = cut(DateTime, "15 min")) %>%
summarise(mean(ActivePower),
median(ActivePower),
max(ActivePower))
还有很多事情可以完成:D