将DNA序列转换为R / Weka的数值向量

时间:2016-12-05 15:11:50

标签: dna-sequence

我想在Weka中使用机器学习技术(如Naive Bayes和SVM)来识别使用DNA序列数据的物种。 问题是我必须将DNA序列转换成数字载体。

我的序列是这样的:

----------------------------------------------- -G ------------------------------------------ GGAGATG ------------------------------------------ GGAGATG ------------------------------------------ GGAGATG TTATTAATTCGAGCAGAATTAGGAAATCCTGGATCTTTAATTGGTGATG ---------------------------------------------- ATG CTATTAATTCGAGCTGAGCTAAGCCAGCCCGGGGCTCTGCTCGGAGATG ----------------------- TCAACCTGGGGCCCTACTCGGAGACG ---- TAATCCGAGCAGAATTAAGCCAACCTGGCGCCCTACTAGGGGATG CTATTAATTCGAGCTGAGCTAAGCCAGCCTGGGGCTCTGCTCGGAGATG TTATTAATTCGTTTTGAGTTAGGCACTGTTGGAGTTTTATTAG --- ATA

我该怎么做?除了Weka之外,还有其他关于用DNA序列进行ML的程序的建议吗?

0 个答案:

没有答案