遍历相关矩阵以找到最近邻居的最快方法

时间:2019-01-14 19:17:37

标签: performance search matrix correlation

我已经计算了几个主题的嵌入(矢量表示)(通过对与它们相关的文本的句子嵌入进行平均),然后计算了它们之间的相关矩阵。

Illustration of Correlation Matrix of Topics (actual matrix is quite large

现在给定一个新主题,例如“软件”,我想找到最接近哪个主题。我可以计算新主题的嵌入与每个现有主题之间的余弦相似度,但是如果现有主题的数量很大,这将花费很多时间。给定任何新主题,我是否可以使用相关矩阵中的接近度信息快速遍历/跳过并到达最近的现有邻居?

0 个答案:

没有答案