Python / Pandas - 计算具有特定索引的行数

时间:2017-08-24 00:48:12

标签: python pandas

我有这个数据框:

     content
id         
17         B
17         A
 6         A
15         A
...

我想计算索引17的行数(在这种情况下为2)。 有没有办法做到这一点?

3 个答案:

答案 0 :(得分:2)

您可以分组级别

df.groupby(level=0).count()

reset_index()

df.reset_index().groupby('id').count()

答案 1 :(得分:1)

您可以尝试:

sum(df.index == 17)
当索引值与其他df.index == 17匹配时,

boolean会返回一个TrueFalse的数组。而且 使用sum函数True相当于1

答案 2 :(得分:1)

问题:如何计算索引标签的数量?

Input: # Your DataFrame
       test_dict = {'id': ['17', '17', '6', '15'], 'content': ['B', 'A', 'A', 'A']}
       testd_df = pd.DataFrame.from_dict(test_dict) # create DataFrame from dict
       testd_df.set_index('id', inplace=True) # set 'id' as index in inplace way
       testd_df
Output: 
             |content
        --------------
         id  |
        -------------
         17  |      B
         17  |      A
          6  |      A
         15  |      A

解决方案:使用api pandas.Index.value_counts

根据文档,pandas.Index.value_counts将返回包含唯一值计数的对象,并返回pd.Series

现在,我可以使用pandas.Series.loc选择想要的特定索引(不要与.iloc混淆)

# Solution
Input:  index_count = pd.Index(testd_df.index).value_counts() # count value of unique value
        index_count

Output: 17    2
        15    1
        6     1
        dtype: int64
---------------------------------
Input:  index_count.loc['17'] # select the information you care about
Output: 2