标签: python python-3.x similarity cosine-similarity fuzzy-logic
数据是
=FORMAT(First(Fields!Time.Value, "dataset"),"hh\.mm")
我想创建一个包含“id”、“similar_count”和“not_similar_count”列的新数据框。
相似的计数将具有与该 ID 相似的计数“添加”。不相似计数不会有与该 ID 相似的计数“添加”。
enter image description here
id =1 有 3 个相似的 'add' 和 1 个不相似的 'add'。