我正在用Morgan指纹的scikit学习训练一个随机的森林,并想知道哪些结构图案最重要。为此,我想绘制所有在 x 最重要特征中产生位的片段。
我在新版本和这些使用示例中找到了Draw.DrawMorganBits
模块:
https://iwatobipen.wordpress.com/2018/11/07/visualize-important-features-of-machine-leaning-rdkit/
http://rdkit.blogspot.com/2018/10/using-new-fingerprint-bit-rendering-code.html
但是,我不知道如何产生一组独特的片段。以前,我通过测试集,收集了位信息和分子环境,并使用Chem.MolFragmentToSmiles
创建了SMILES。然后我从这些SMILES的 set 中创建了分子,并绘制了它们。但是,这是环境的一种较弱的表示,无法绘制一些片段。
我可以提供旧代码。它遵循旧文档https://rdkit.readthedocs.io/en/release_2017_03_1/GettingStartedInPython.html#explaining-bits-from-morgan-fingerprints