如何在机器学习中将文本作为特征和价值提供?

时间:2017-11-12 06:25:53

标签: machine-learning svm random-forest knn supervised-learning

目前,我正致力于基于文本的机器学习。我是ML的新手。我从输入文本中提取了不同的功能,如:Feature1,Feature2等,其值为value1,value2。 ML算法要学习的输出应该是一些文本,如:Output1,Output2。我想知道哪种最佳ml算法可以使用,什么是训练数据格式?

1 个答案:

答案 0 :(得分:1)

我建议您查看bag of words approach

它基本上计算每个文档中唯一单词的频率,并将每个文档表示为一个向量,其中唯一的单词是您的功能。

然后,您可以将其用作您决定使用的任何机器学习模型的输入。 一个好的机器学习模型可能是k-means clusteringsupport vector machines,但最好的"模型取决于您尝试解决的问题类型。