Pandas数据框对象行为

时间:2015-12-05 23:03:39

标签: python pandas

我有一个csv文件,如下所示

Hour,L,Dr,Tag,Code,Vge
0,L5,XI,PS,4R,15
0,L3,St,sst,4R,17
5,L5,XI,PS,4R,12
2,L0,St,v2T,4R,11
8,L2,TI,sst,4R,8
12,L5,XI,PS,4R,18
2,L2,St,PS,4R,9
12,L3,XI,sst,4R,16

我在ipython笔记本中执行以下脚本。

In[1]
    import pandas as pd
In[2]
    df = pd.read_csv('/python/concepts/pandas/in.csv')
In[3]    
    df.head(n=9)

Out[1]: 

       Hour   L  Dr  Tag Code  Vge
    0     0  L5  XI   PS   4R   15
    1     0  L3  St  sst   4R   17
    2     5  L5  XI   PS   4R   12
    3     2  L0  St  v2T   4R   11
    4     8  L2  TI  sst   4R    8
    5    12  L5  XI   PS   4R   18
    6     2  L2  St   PS   4R    9
    7    12  L3  XI  sst   4R   16

In[4]
    df.groupby(('Hour'))['Vge'].head(n=9)
Out[2]

    0    15
    1    17
    2    12
    3    11
    4     8
    5    18
    6     9
    7    16
    Name: Vge, dtype: int64

输出似乎没有按Hour分组。而是看起来它按dataframe内部索引的顺序输出。

我正在尝试了解Pandas数据帧中的groupby使用情况。使用情况尚未对我有所影响。如果有人能指导我,我们将不胜感激。

1 个答案:

答案 0 :(得分:1)

你需要对这些小组做些什么。例如:

if($_POST["Submit"])
{
echo $name = $_FILES['file']['name'];
$size = $_FILES['file']['size'];
$type = $_FILES['file']['type'];
$tmp_name = $_FILES['file']['tmp_name'];
}

或:

>>> df.groupby('Hour').sum()
      Vge
Hour     
0      32
2      20
5      12
8       8
12     34