熊猫数据框中的余弦相似以查找相似项

时间:2021-02-24 14:01:57

标签: python python-3.x similarity cosine-similarity fuzzy-logic

数据是

=FORMAT(First(Fields!Time.Value, "dataset"),"hh\.mm")

我想创建一个包含“id”、“similar_count”和“not_similar_count”列的新数据框。

相似的计数将具有与该 ID 相似的计数“添加”。不相似计数不会有与该 ID 相似的计数“添加”。

enter image description here

id =1 有 3 个相似的 'add' 和 1 个不相似的 'add'。

enter image description here

0 个答案:

没有答案