Question

我使用以下代码使用jpmml-sklearn（在python中）生成了用于文本分类的PMML文件：

Textpipeline = PMMLPipeline([
    ("tf-idf", TfidfVectorizer(analyzer = "word", preprocessor = None, strip_accents = None, token_pattern = None, tokenizer = Splitter(), stop_words = "english", ngram_range = (1, 2), norm = None,max_features = 50)),
    ("classifier", SGDClassifier())
])

Textpipeline.fit(data.data, data.target)

from sklearn2pmml import sklearn2pmml

sklearn2pmml(Textpipeline, "TextMiningClassifier_SGD_Classifier.pmml", with_repr = True)

现在，我想把这个PMML（训练模型）放在我可以导入它的地方（在某些平台，比如说JAVA或其他平台）并对输入文本进行分类。

很高兴知道如何导入上述PMML模型，并在新数据集上生成预测（在这种情况下只是输入文本的分类）。

感谢您的任何帮助。

正在使用的PMML（用于文本分类）

0 个答案: