我想在Weka中使用机器学习技术(如Naive Bayes和SVM)来识别使用DNA序列数据的物种。 问题是我必须将DNA序列转换成数字载体。
我的序列是这样的:
----------------------------------------------- -G ------------------------------------------ GGAGATG ------------------------------------------ GGAGATG ------------------------------------------ GGAGATG TTATTAATTCGAGCAGAATTAGGAAATCCTGGATCTTTAATTGGTGATG ---------------------------------------------- ATG CTATTAATTCGAGCTGAGCTAAGCCAGCCCGGGGCTCTGCTCGGAGATG ----------------------- TCAACCTGGGGCCCTACTCGGAGACG ---- TAATCCGAGCAGAATTAAGCCAACCTGGCGCCCTACTAGGGGATG CTATTAATTCGAGCTGAGCTAAGCCAGCCTGGGGCTCTGCTCGGAGATG TTATTAATTCGTTTTGAGTTAGGCACTGTTGGAGTTTTATTAG --- ATA
我该怎么做?除了Weka之外,还有其他关于用DNA序列进行ML的程序的建议吗?