我使用以下代码使用jpmml-sklearn(在python中)生成了用于文本分类的PMML文件:
Textpipeline = PMMLPipeline([
("tf-idf", TfidfVectorizer(analyzer = "word", preprocessor = None, strip_accents = None, token_pattern = None, tokenizer = Splitter(), stop_words = "english", ngram_range = (1, 2), norm = None,max_features = 50)),
("classifier", SGDClassifier())
])
Textpipeline.fit(data.data, data.target)
from sklearn2pmml import sklearn2pmml
sklearn2pmml(Textpipeline, "TextMiningClassifier_SGD_Classifier.pmml", with_repr = True)
现在,我想把这个PMML(训练模型)放在我可以导入它的地方(在某些平台,比如说JAVA或其他平台)并对输入文本进行分类。
很高兴知道如何导入上述PMML模型,并在新数据集上生成预测(在这种情况下只是输入文本的分类)。
感谢您的任何帮助。