我有一个大型智能电表数据集,有超过一百万行。数据看起来像这样
customer number time load
1000 19501 1.5
.... ..... ...
1000 19548 1.5
1000 19600 1.5
1000 ... ..
1000 19648 1.5
. . .
1001 19501 1.5
. . .
第一列是客户编号,第二列显示数据和时间,第三列显示加载。日期时间从19501年开始,一直到48,然后变为19600,类似于7天。现在我想使用群集在matlab中分析这些数据。首先,数据采用.txt格式,由于行数较多,因此无法在matlab中打开。
我在excel中打开它(尽管它没有完全读取它,但仍然有一百万行数据对我来说已经足够了)。我减少了行数,以便它们可以被matlab读取,并使用过滤器排列数据,从19501年到最后一次读取该客户,然后是第二个客户等,为个别客户安排数据。对于我的matlab集群,我需要19501-19548小时的数据,然后是下一行的下一个48个读数,直到最后一个客户为止。
是否可以使用可以自动执行的matlab代码,还是可以在excel中查找某些内容?