基于桶的直方图

时间:2014-02-10 05:57:43

标签: python sorting histogram ranking

我的数据以下列方式查看(空格分隔):

A   B
492 67
501 67
507 67
510 0
51  67
516 0
522 0
525 67
528 0
56  0
542 675
548 0
551 65237
556 0
562 446
568 447
575 4461
581 4464
591 44614
602 4464

What I would like to see is a histogram of A's that gives 90% of all B's.

这是我尝试过的。 双列表数据集

dataset = [[],[]]

包含数据集[0]中A的内容和数据集[1]中B的内容。

我创建了元素num_buckets,以便我可以将基于排名的数据推送到存储桶列表。

def parse_dataset(dataset):
    sums = [[],[],[],[],[]]
    for s in range(1, len(dataset)):
        sums[s] =  sum(dataset[s])
    for a in range(0, len(dataset)):
        rankdict = {v: k for k,v in enumerate(sorted(set(dataset[a])))}
        ranked = [rankdict[b] for b in dataset[a]]
        sorted_rank = sorted(zip(ranked, dataset[0]))
        max_rank = max(ranked)
        min_rank = min(ranked)
        num_buckets =  (max(ranked) - min(ranked)) / 9
        buckets = [[] for q in range(num_buckets)]
        for z in range(0, len(sorted_ranks)):
            if min_rank =< sorted_ranks[z][0] < 9:
                buckets[0].append(sorted_ranks)

                ....

如果遗漏了一些重要信息,请告诉我。

1 个答案:

答案 0 :(得分:1)

一个好的策划选项是尝试matplotlib package。请注意,它依赖于numpy package。 有很多关于如何在那里做不同图表的例子。如果您想了解更多关于如何解析数据的信息,请在此处发表评论,我会看到我能做些什么。