Pyplot自动排序y值

时间:2017-11-19 04:46:27

标签: matplotlib frequency-analysis

我对自己最喜欢的节目的剧集进行了频率分析。我正在制作plot.barh(s1e1_y,s1e1_x),但它按字而不是值排序。 >>> s1e1_y的输出 是

['know', 'go', 'now', 'here', 'gonna', 'can', 'them', 'think', 'come', 'time', 'got', 'elliot', 'talk', 'out', 'night', 'been', 'then', 'need', 'world', "what's"]

>>>s1e1_x

[42, 30, 26, 25, 24, 22, 20, 19, 19, 18, 18, 18, 17, 17, 15, 15, 14, 14, 13, 13] 当实际绘制图表时,即使绘图列表未排序,图表的y轴刻度也会按字母顺序排序...

s1e1_wordlist = []
s1e1_count = []
for word, count in s1e01:
    if((word[:-1] in excluded_words) == False):
        s1e1_wordlist.append(word[:-1])
        s1e1_count.append(int(count))
s1e1_sorted = sorted(list(sorted(zip(s1e1_count, s1e1_wordlist))), 
reverse=True)
s1e1_20 = []
for i in range(0,20):
    s1e1_20.append(s1e1_sorted[i])
s1e1_x = []
s1e1_y = []
for count, word in s1e1_20:
    s1e1_x.append(word)
    s1e1_y.append(count)
plot.figure(1, figsize=(20,20))
plot.subplot(341)
plot.title('Season1 : Episode 1')
plot.tick_params(axis='y',labelsize=8)
plot.barh(s1e1_x, s1e1_y)

2 个答案:

答案 0 :(得分:6)

从matplotlib 2.1开始,您可以绘制分类变量。这允许绘制plt.bar(["apple","cherry","banana"], [1,2,3])。但是在matplotlib 2.1中,输出将按类别排序,因此按字母顺序排序。这被视为错误,并在matplotlib 2.2中进行了更改(请参阅this PR)。

在matplotlib 2.2中,条形图将因此保留顺序。 在matplotlib 2.1中,您可以将数据绘制为2.1之前的任何版本中的数字数据。这意味着根据索引绘制数字并相应地设置标签。

w = ['know', 'go', 'now', 'here', 'gonna', 'can', 'them', 'think', 'come', 
 'time', 'got', 'elliot', 'talk', 'out', 'night', 'been', 'then', 'need', 
 'world', "what's"]
n = [42, 30, 26, 25, 24, 22, 20, 19, 19, 18, 18, 18, 17, 17, 15, 15, 14, 14, 13, 13]

import matplotlib.pyplot as plt
import numpy as np

plt.barh(range(len(w)),n)
plt.yticks(range(len(w)),w)

plt.show()

enter image description here

答案 1 :(得分:1)

好的,您的示例中似乎有很多虚假代码与您所描述的问题无关,但假设您不希望y轴按字母顺序排序然后您需要将两个列表压缩到数据帧中,然后按如下方式绘制数据帧

df = pd.DataFrame(list(zip(s1e1_y,s1e1_x))).set_index(1)

df.plot.barh()

然后产生以下

enter image description here