分类数据的列总数

时间:2014-08-12 01:23:10

标签: calculated-columns

如何获取数据框中每列(总共100个)的总计。我的数据是定性类型。

例如

ID1   ID2   ID3   ID4   ID5     ID100

Y     N 
Y     Y
N     N
N     Y

我想找到ID1,ID2等中的总列数(Y和N的数量)....

我尝试输入以下代码

colSums(mydata[,[1:ncol(mydata)]

提前致谢

1 个答案:

答案 0 :(得分:0)

如果您有关于您为阵列使用哪个包的信息,我可能会更具体。这是一个通用解决方案,假设您的数组是一个列表列表'其中每列是较大列表中的列表项。

def sum_array(array):
    """ Returns the number of Y, N for each column """
    for column in array:
        y_count = 0
        n_count = 0
        for cell in column:
            if cell == "Y":
                y_count += 1
            elif cell == "N":
                n_count += 1
            else:
                raise TypeError("bad entry")
        # print out count for each column
        print "column ", column, " has Y: ", y_count, " and N: ", n_count, " entries."

如果您可以提供更多信息,我会尝试为您提供更具体的解决方案。