我正在使用Python并且之前从未使用它来绘制情节,并且想知道是否有办法执行以下操作。我有一个包含百分比(DNA甲基化数据)列的文件。我想绘制分布频率(可能使用10的二进制数)来显示数据。有没有办法在python中这样做。
答案 0 :(得分:1)
Matplotlib是您想要探索的工具。这是一个很好的教程,尝试完成该教程中的示例。 http://bespokeblog.wordpress.com/2011/07/11/basic-data-plotting-with-matplotlib-part-3-histograms/
本教程包括在ubuntu中安装matplotlib。如果您使用的是Windows,则应从http://matplotlib.org/downloads.html
下载安装程序答案 1 :(得分:0)
如果您的RAW甲基化数据以.idat
文件的形式出现(Illumina使用此文件),请查看methylprep
python程序包(及其相关的methylcheck
程序包以进行绘图)。
对于甲基化数据,大多数人将样品绘制为beta distribution
或m_value plot
来显示每个探针的甲基化百分比(但实际上是从0到1的分数,而不是百分比)。
使用将是这样的:
CLI: `python -m methylprep process -d <folder_path_of_idats> --all`
python:
>>>import methylcheck
>>>df = methylcheck.load(<path>) # creates a pandas dataframe of all samples in the folder you are in, or path specified.
>>>methylcheck.sample_plot(df)
在下面的jupyter笔记本中生成的情节示例