我有一个像
这样的文字"India, officially the Republic of India is a country in South Asia."
我需要它才能给我,
Country: India
Region: South Asia
无论我在scikit的文档中发现了什么,它都可以将它分类为一个类别,例如我可以在两个分类器上训练它来检查一个国家是否存在或区域是否存在,但我希望它告诉我哪个功能对于每个分类,它都像NLTK最丰富的功能一样。 我该怎么做?
答案 0 :(得分:0)
如果您在交叉验证时使用SVM this question可能会让您入门。这个想法是解释分类权重,但这不是微不足道的。
就个人而言,我更喜欢使用内置功能排名的RandomForestClassifier
。它由feature_importances_
属性公开。在scikit-learn文档中甚至有an example。