标签: similarity rapidminer
我正在使用Rapidminer,但我不知道如何实现模型。 我有一个带有文本的几列的数据集。将数据集的每一行与同一数据集的其他行进行比较,我需要这些文本之间的相似性。数据集的这些列之一(x列)是我试图通过相似性“预测”的信息。也就是说,我知道如果我的数据集的第1行和第2行非常相似,则它们应该与第x列共享相同的信息。如果数据集的第1列和第3列不相似,则它们在x列中具有不同的信息。如何获得此数据集的准确性(和其他指标),将相似性与列x的内容相关联?
非常感谢:)