我正在处理一个包含有机体中数千种蛋白质的文件。我的代码可以让我逐个检查每种蛋白质,并确定每种蛋白质的氨基酸频率。有没有办法改变我目前的代码,让我一次确定氨基酸的所有频率?
答案 0 :(得分:1)
IIUC,您重新发明了一点:documentation包含用于处理各种格式文件的实用程序(在您的情况下为FASTA),以及简单的分析。对于你的例子,我使用这样的东西:
Vector3 f; // from OpenCV
Vector3 u; // from OpenCV
// notice that Y coordinates here are inverted to pass from OpenCV right-handed coordinates system to Unity left-handed one
Quaternion rot = Quaternion.LookRotation(new Vector3(f.x, -f.y, f.z), new Vector3(u.x, -u.y, u.z));
答案 1 :(得分:0)
答案是肯定的,但如果没有向我们展示您的代码,我们就无法提供更多反馈。基本上你想要在阅读FASTA记录之间保持你的氨基酸计数。如果你想要概率,那么你就可以在循环之外将它们加起来并仅在最后进行分割。这是一个简单的完成,没有类似于"计数字典"在Python中或增加散列/字典中的值。也很可能有很多命令行工具可以帮到你,因为你想要的只是任何不以'>'开头的行的字符级别计数。在文件中。
例如,对于小文件:
_testReportFilePath.yml