我有一个看起来像这样的数据集
43466 1323.507803
43467 1396.948621
43468 1481.437362
43469 1611.111671
43470 1379.217261
43471 1425.450351
我正在尝试使用Python Pandas遍历数据集,并设置每天的x和y轴以查看最近30天,这里我使用一个较小的集合进行简短说明-最近3天
我已经正确遍历了行,但是我不确定为什么这行不通。
我正在使用
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
dataset = pd.read_csv('~/Desktop/test2.csv')
df = pd.DataFrame(dataset)
for row in dataset.head(2).itertuples():
#print(row.Date)
print(dataset.loc[dataset["Date"]==row.Date].tail(5))
我现在得到的是:
Date Usage
0 43466.0 1323.507803
Date Usage
1 43467.0 1396.948621
如果我遍历该行-我希望每次打印都在该行的日期==处开始。最终的印刷应该看起来像这样
行索引0打印
43466 1323.507803
行索引1打印
43466 1323.507803
43467 1396.948621
第2行索引打印
43466 1323.507803
43467 1396.948621
43468 1481.437362
。 。 。 。 。 一直到行索引5打印
43466 1323.507803
43467 1396.948621
43468 1481.437362
43469 1611.111671
43470 1379.217261
43471 1425.450351