我有一个csv文件看起来像~5M行:
11/8/2016 2.495418222 2.501995109 2.488331492 2.504259694
11/8/2016 2.495759632 1.213707641 2.137418322 2.501118589
11/8/2016 2.495565218 3.050992103 0.870950956 2.500971719
11/8/2016 2.494934557 2.500041484 2.489212707 2.455110626
我试图找到10000行样本的最大值和最小值,并迭代直到数据结束。 (找到多个最大值和分钟的趋势)。 我的代码目前只每10000行抓取一个值,而不是我上面要求的值。
lcd = pan.read_csv('DAQ_Test_2016-08-11.csv',usecols=[0,2,3,4,5],skiprows=[0,1,2],na_filter=False)
lcd = np.array(lcd)
tslen2 = len(lcd[:,0])
rph2 = 57600
sfr2 = tslen2/((tslen2/rph2)*(2))
currentdata = (lcd[0::sfr2])
答案 0 :(得分:2)
你可以试试这个:
lcd = pan.read_csv('DAQ_Test_2016-08-11.csv',usecols=[0,2,3,4,5],skiprows=[0,1,2],na_filter=False)
# Group by every 10,000 rows
groups = lcd.groupby(pd.cut(lcd.index, range(0,len(lcd), 10000)))
groups.min()
groups.max()