标签: machine-learning deep-learning bioinformatics data-science protein-database
有人可以指导我如何使用机器学习技术从蛋白质序列中预测信号肽吗?
任何指南,参考或教程都将非常有帮助。
先谢谢您。
答案 0 :(得分:1)
有许多tools可以预测信号肽。我会先使用它们。大多数信号肽也在Uniprot数据库中标注。
但是,如果您决定进一步开发该方法,则首先需要在完整蛋白质序列的背景下构建信号肽序列的数据集。然后,我将在这些序列上训练一个递归神经网络,以完整的蛋白质序列作为输入,并以信号肽概率作为输出。这可能开箱即用,因此您需要做很多调整。