我正在使用nltk
建立一个命名实体分类器,我专注于位置检索(任何类型,从国家到博物馆,餐馆或道路)。我正在尝试改变我使用的功能集和方法。
目前,我使用了NLTK的内置Maxent
,NaiveBayes
,PositiveNaiveBayes
,DecisionTrees
和SVM
。我正在使用40种不同的功能集组合。
Maxent
似乎是最好的,但它太慢了。 nltk
的{{1}}用于二进制分类,我在挑选最终分类器时遇到了一些问题。然后我尝试了SVM
nltk
的包装器,但它不接受我的输入,我试图适应但有一些浮动强制问题。
现在,我正在考虑将scikit-learn SVM
的包装用于nltk
,但我不知道它是否能给我一些非常不同的结果值得尝试而不必很多时间。我的问题是,Weka
比Weka
的内置分类器有什么优势?