machine-learning - 如何在机器学习中将文本作为特征和价值提供？ - Thinbug

如何在机器学习中将文本作为特征和价值提供？

时间：2017-11-12 06:25:53

标签： machine-learning svm random-forest knn supervised-learning

目前，我正致力于基于文本的机器学习。我是ML的新手。我从输入文本中提取了不同的功能，如：Feature1，Feature2等，其值为value1，value2。 ML算法要学习的输出应该是一些文本，如：Output1，Output2。我想知道哪种最佳ml算法可以使用，什么是训练数据格式？

1 个答案:

答案 0 :(得分：1)

我建议您查看bag of words approach。

它基本上计算每个文档中唯一单词的频率，并将每个文档表示为一个向量，其中唯一的单词是您的功能。

然后，您可以将其用作您决定使用的任何机器学习模型的输入。一个好的机器学习模型可能是k-means clustering或support vector machines，但最好的＆＃34;模型取决于您尝试解决的问题类型。