我需要为我的主体绘制zipf的分布。但是,我不知道如何绘制它。我在这个话题上很新。我找到了一些StackOverflow答案,但是图形看起来并不理想。我有以下数据(word-frequency-percentage)。 (单词使用孟加拉语Unicode,因此,在这里我使用了音译)
- 哦-1219357-1.218%
- kore-744568-0.744%
- eh-723214-0.723%
- theke-651366-0.651%
- 不适用-630856-0.630%
- 科拉-563658-0 0.563%
等等。 我不知道绘制zipf的分布图需要多少个单词。希望这可以帮助。 我需要这样的图(来自另一个语料库)。 click here to see the image 。请通过提供适当的代码(使用Java或python)或建议在线工具(如果有)来帮助我。如果您需要其他任何信息,请在下面评论。谢谢。