目前,我正致力于基于文本的机器学习。我是ML的新手。我从输入文本中提取了不同的功能,如:Feature1,Feature2等,其值为value1,value2。 ML算法要学习的输出应该是一些文本,如:Output1,Output2。我想知道哪种最佳ml算法可以使用,什么是训练数据格式?
答案 0 :(得分:1)
我建议您查看bag of words approach。
它基本上计算每个文档中唯一单词的频率,并将每个文档表示为一个向量,其中唯一的单词是您的功能。
然后,您可以将其用作您决定使用的任何机器学习模型的输入。 一个好的机器学习模型可能是k-means clustering或support vector machines,但最好的"模型取决于您尝试解决的问题类型。