R中的核岭回归(用于药物 - 靶标相互作用)

时间:2016-04-24 08:23:38

标签: r machine-learning kernel regression

很难找到有关实施KRR的任何信息,因此任何次要的投入都将受到高度赞赏。

我想在我计算的一组内核上运行Kernel Ridge回归,但我不知道如何在R中执行此操作。我从CVST包中找到了constructKRRLearner函数,但手册并不清楚,特别是对我来说是机器学习的完全初学者。函数需要和x和y,但我不知道在那里输入什么,因为我只有一个数据框,其成对内核被计算为药物和蛋白质之间的kronecker产品。

如何在R中执行Kernel Ridge回归任务?

理想情况下,我还希望可视化我的数据点,然后在情节上说明回归线!例如:

http://scikit-learn.org/stable/_images/plot_kernel_ridge_regression_0011.png

关于我的数据集的更多信息

我有药物 - 目标相互作用(DTI)数据集。该数据集包含100种药物化合物(行)和100种蛋白激酶靶标(列)。此数据集中有一些NAN(缺失值)。此数据集中的值反映了化合物与目标的结合程度。

我有药物'SMILES和CHEMBL ID。

我有蛋白质(目标)序列和UNIPROT ID。

对于药物[100种药物]:我将药物SMILES转换为SDFset,然后使用OpenBabel计算每种药物的指纹。基于这些指纹,我计算了Tanimoto内核中药物之间所有可能的组合。 (使用“fpSim”功能),例如药物1与药物2,3,4,... 10.然后药物2与药物1,3,4 ... 100等,直到药物99与药物100.我命名为BASE_DRUG_KERNELS

对于蛋白质:我有蛋白质序列,因此我计算了所有蛋白质对组合的Smith-Waterman分数;例如蛋白质1含蛋白质2,3,... 100,然后蛋白质2含蛋白质1,3,4,... 100等等,直到蛋白质99含蛋白质100.我将此命名为BASE_PROTEIN_KERNELS

然后我计算了BASE_DRUG_KERNELS和BASE_PROTEIN_KERNELS之间的Kronecker,它给了我一个100,000,000个元素的矩阵。我将此矩阵命名为KRONECKER_PRODUCTS

我希望在矩阵KRONECKER_PRODUCTS上运行Kernel Ridge回归。

0 个答案:

没有答案