计算"少于计数"在使用熊猫的df列上

时间:2015-06-29 09:52:10

标签: python pandas

我的原始数据如下:

public class SumOfDigits {

public static void main(String[] args) 
{
    long num = 321;

/*  int rem,sum=0;
    while(num!=0)
    {
        rem = num%10;
        sum = sum+rem;
        num=num/10;
    }
    System.out.println(sum);

    */
    if(num!=0)
    {
        long sum = ((num%9==0) ? 9 : num%9);
        System.out.println(sum);
    }

}

我的数据框:

id_2    column_A
602     1
602     1
602     1
602     1
602     3
602     8
602     15
602
602

我的要求是: 我必须找到df = pd.read_csv('xxyy.csv') df = df.fillna(np.nan)

的每个值的小于计数

编辑:

ex:(for 1 its 0, for 3 its 4,etc)

我得到的是:

3为5,其中6为6,其中15为4,我想要的是: 对于3应该是6,对于8应该是7,对于15它应该是8(包括2纳米)

1 个答案:

答案 0 :(得分:0)

如果我理解正确,那么您只需过滤df并拨打In [52]: df[df['column_A'] < 3].count() Out[52]: column_A 4 id_2 4 dtype: int64 In [54]: df[df['column_A'] < 8].count() Out[54]: column_A 5 id_2 5 dtype: int64 In [55]: df[df['column_A'] < 15].count() Out[55]: column_A 6 id_2 6 dtype: int64

In [56]:
def func(x):
    return df[df['column_A'] < x].count()
​
func(3)

Out[56]:
column_A    4
id_2        4
dtype: int64

你可以将它包装在一个函数中并传递你想要的值:

{{1}}