我在生物信息学方面完成了一些研究工作,我使用了Matlab。 Matlab有很多强大的工具,易于使用。我确实考虑过基因组测序和预测代谢途径。我想知道其他人认为最好的是什么?或者可能没有一种特定的语言,只有少数几种能够最好地利用生物信息学的工作,这种工作是数学上的,并处理大量的数据。
答案 0 :(得分:14)
您可能会对BioStar的这个主题感兴趣:
对于我们大多数生物信息学家来说,这包括Python,R,Perl和bash命令行实用程序(如sed,awk,cut,sort等)。还有人用Java,Ruby,C ++和Matlab编写代码。
那么底线?无论哪种语言都能让您轻松完成工作,这对您来说是正确的。回答这个问题应该包括仔细调查您可以从中获取的库和其他代码,以及有关您自己的偏好和经验的信息。如果您正在进行微阵列分析,那么很难击败R / bioconductor库,但对于那些争论大多数类型的大型测序数据集的人来说,这绝对是错误的语言。
答案 1 :(得分:7)
生物信息学没有合适的语言。
总的来说,我看到很多C和C ++用于性能关键代码和许多脚本语言。
答案 2 :(得分:5)
Python + scipy很不错(而且是免费的)。
http://www.vetta.org/2008/05/scipy-the-embarrassing-way-to-code/
当放弃Matlab for SciPy时,你甚至不需要学习新的语法。
答案 3 :(得分:4)
最好与否,SAS是生物圈中的事实上的编程环境。如果您为生物信息学领域的辉瑞,Mercks和拜耳公司工作,您最好拥有SAS技能。 SAS程序员的需求量很大。
答案 4 :(得分:1)
什么是“最佳”语言既是主观的又可能因任务而异,但对于生物信息学工作,我个人使用R,Perl,Delphi和C(通常是其中几种的组合)。
答案 5 :(得分:1)
我主要使用HMM和蛋白质序列。我开始用C编写,但后来切换到Python,我很高兴。我发现快速原型化更容易,并且更容易维护代码。
答案 6 :(得分:0)
这是一篇免费提供的关于该主题的学术论文,评估不同的语言,并在不同的情况下:http://www.biomedcentral.com/1471-2105/9/82
他们将6种常用语言分为3个不同的级别。
2 compiled languages: C, C++
2 semi-compiled languages: C#, Java
2 interpreted languages: Perl, Python
一些一般性结论:
这是另一篇很好的免费学术文章,讨论如何建立生物信息学技能:http://dx.plos.org/10.1371/journal.pcbi.1000589