正在使用的PMML(用于文本分类)

时间:2017-06-19 10:32:29

标签: nlp pmml

我使用以下代码使用jpmml-sklearn(在python中)生成了用于文本分类的PMML文件:

Textpipeline = PMMLPipeline([
    ("tf-idf", TfidfVectorizer(analyzer = "word", preprocessor = None, strip_accents = None, token_pattern = None, tokenizer = Splitter(), stop_words = "english", ngram_range = (1, 2), norm = None,max_features = 50)),
    ("classifier", SGDClassifier())
])

Textpipeline.fit(data.data, data.target)

from sklearn2pmml import sklearn2pmml

sklearn2pmml(Textpipeline, "TextMiningClassifier_SGD_Classifier.pmml", with_repr = True)

现在,我想把这个PMML(训练模型)放在我可以导入它的地方(在某些平台,比如说JAVA或其他平台)并对输入文本进行分类。

很高兴知道如何导入上述PMML模型,并在新数据集上生成预测(在这种情况下只是输入文本的分类)。

感谢您的任何帮助。

0 个答案:

没有答案