我的数据以下列方式查看(空格分隔):
A B
492 67
501 67
507 67
510 0
51 67
516 0
522 0
525 67
528 0
56 0
542 675
548 0
551 65237
556 0
562 446
568 447
575 4461
581 4464
591 44614
602 4464
What I would like to see is a histogram of A's that gives 90% of all B's.
这是我尝试过的。 双列表数据集
dataset = [[],[]]
包含数据集[0]中A的内容和数据集[1]中B的内容。
我创建了元素num_buckets,以便我可以将基于排名的数据推送到存储桶列表。
def parse_dataset(dataset):
sums = [[],[],[],[],[]]
for s in range(1, len(dataset)):
sums[s] = sum(dataset[s])
for a in range(0, len(dataset)):
rankdict = {v: k for k,v in enumerate(sorted(set(dataset[a])))}
ranked = [rankdict[b] for b in dataset[a]]
sorted_rank = sorted(zip(ranked, dataset[0]))
max_rank = max(ranked)
min_rank = min(ranked)
num_buckets = (max(ranked) - min(ranked)) / 9
buckets = [[] for q in range(num_buckets)]
for z in range(0, len(sorted_ranks)):
if min_rank =< sorted_ranks[z][0] < 9:
buckets[0].append(sorted_ranks)
....
如果遗漏了一些重要信息,请告诉我。
答案 0 :(得分:1)
一个好的策划选项是尝试matplotlib package。请注意,它依赖于numpy package。 有很多关于如何在那里做不同图表的例子。如果您想了解更多关于如何解析数据的信息,请在此处发表评论,我会看到我能做些什么。