为最符合生物信息学需求的Python开发环境提供建议

时间:2016-04-27 17:52:02

标签: python numpy anaconda bioinformatics biopython

我需要在Python中实现一个项目,该项目通过FFT,互相关,3D谐波和SVM(机器学习)工具处理Cryo EM电子密度扫描(MAP格式)中的氨基酸检测。

有许多可用的Python包,我找不到足够全面的比较表。为了避免试用现有的每一个,请告诉我谁应用这些功能让我使用最合适的包来专注于算法问题,而不是重新发明经典功能的轮子。

1 个答案:

答案 0 :(得分:1)

我首先要安装“The SciPy Stack”,其核心包包括(其中包括):

  • NumPy,数值计算的基本包。它定义了数值数组和矩阵类型以及它们的基本操作。
  • SciPy library,一组数值算法和特定领域的工具箱,包括信号处理(包括FFT),优化,统计等等。
  • Matplotlib,一个成熟且受欢迎的绘图包,提供出版品质的2D绘图以及基本的3D绘图
  • pandas,提供高性能,易于使用的数据结构。

许多其他软件包都是基于这些核心软件包构建的:

  • 由于您正在处理生物数据,我还建议您安装BioPython
  • 要使用SVM并进行机器学习,请安装scikit-learn
  • 我从未使用它,但专门用于使用Cryo EM电子密度扫描,存在TEMPy
  

一个面向对象的Python库,旨在帮助用户   分析大分子组装体的结构,尤其是大分子组件   三维电子显微镜密度图的背景。

另请参阅this related question