Question

我有一个看起来像这样的数据集

43466   1323.507803
43467   1396.948621
43468   1481.437362
43469   1611.111671
43470   1379.217261
43471   1425.450351

我正在尝试使用Python Pandas遍历数据集，并设置每天的x和y轴以查看最近30天，这里我使用一个较小的集合进行简短说明-最近3天

我已经正确遍历了行，但是我不确定为什么这行不通。

我正在使用

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

dataset = pd.read_csv('~/Desktop/test2.csv')
df = pd.DataFrame(dataset)
for row in dataset.head(2).itertuples():
    #print(row.Date)
    print(dataset.loc[dataset["Date"]==row.Date].tail(5))

我现在得到的是：

  Date  Usage
0  43466.0   1323.507803
  Date  Usage
1  43467.0   1396.948621

如果我遍历该行-我希望每次打印都在该行的日期==处开始。最终的印刷应该看起来像这样

行索引0打印

43466   1323.507803

行索引1打印

43466   1323.507803
43467   1396.948621

第2行索引打印

43466   1323.507803
43467   1396.948621
43468   1481.437362

。。。。。一直到行索引5打印

43466   1323.507803
43467   1396.948621
43468   1481.437362
43469   1611.111671
43470   1379.217261
43471   1425.450351

使用iloc获取Itertuples数据帧中的最后N行

0 个答案: