与最近的邻居和tdidf scikit的距离大于1

时间:2020-01-15 13:42:57

标签: scikit-learn tf-idf nearest-neighbor cosine-similarity

如果通过scikit Learn对TfidfVectorizer和NearestNeighbors使用默认参数, 期望将所有矢量标准化为1的长度,因此,距离==余弦距离,即1-余弦相似度。因此,如果余弦相似度在[0-1]的范围内,我何时会得到大于1的距离?对于与自身比较的对象,我得到的距离为0。对于空条目,与非空条目相比,我得到1(好的,可以接受定义)。其他条目总是>1。需要一些帮助来理解,也许还需要一些指导,以做一些与我的直觉更接近的事情。 BR,奥伦。

0 个答案:

没有答案
相关问题