应用错误收集

我正在使用Rapidminer，但我不知道如何实现模型。我有一个带有文本的几列的数据集。将数据集的每一行与同一数据集的其他行进行比较，我需要这些文本之间的相似性。数据集的这些列之一（x列）是我试图通过相似性“预测”的信息。也就是说，我知道如果我的数据集的第1行和第2行非常相似，则它们应该与第x列共享相同的信息。如果数据集的第1列和第3列不相似，则它们在x列中具有不同的信息。如何获得此数据集的准确性（和其他指标），将相似性与列x的内容相关联？

非常感谢：）

基于数据集列的Rapidminer相似模型准确性

0 个答案: