应用错误收集

我需要为我的主体绘制zipf的分布。但是，我不知道如何绘制它。我在这个话题上很新。我找到了一些StackOverflow答案，但是图形看起来并不理想。我有以下数据（word-frequency-percentage）。（单词使用孟加拉语Unicode，因此，在这里我使用了音译）

哦-1219357-1.218％

kore-744568-0.744％

eh-723214-0.723％

theke-651366-0.651％

不适用-630856-0.630％

科拉-563658-0 0.563％

等等。我不知道绘制zipf的分布图需要多少个单词。希望这可以帮助。我需要这样的图（来自另一个语料库）。 click here to see the image 。请通过提供适当的代码（使用Java或python）或建议在线工具（如果有）来帮助我。如果您需要其他任何信息，请在下面评论。谢谢。