如何获取数据框中每列(总共100个)的总计。我的数据是定性类型。
例如
ID1 ID2 ID3 ID4 ID5 ID100
Y N
Y Y
N N
N Y
我想找到ID1,ID2等中的总列数(Y和N的数量)....
我尝试输入以下代码
colSums(mydata[,[1:ncol(mydata)]
提前致谢
答案 0 :(得分:0)
如果您有关于您为阵列使用哪个包的信息,我可能会更具体。这是一个通用解决方案,假设您的数组是一个列表列表'其中每列是较大列表中的列表项。
def sum_array(array):
""" Returns the number of Y, N for each column """
for column in array:
y_count = 0
n_count = 0
for cell in column:
if cell == "Y":
y_count += 1
elif cell == "N":
n_count += 1
else:
raise TypeError("bad entry")
# print out count for each column
print "column ", column, " has Y: ", y_count, " and N: ", n_count, " entries."
如果您可以提供更多信息,我会尝试为您提供更具体的解决方案。