应用错误收集

解决词向量最佳聚类的算法

时间：2018-08-14 03:20:27

标签： algorithm dynamic-programming graph-theory k-means

我将单词向量分为N个组，每个组包含M个向量。问题是要找到向量的最佳聚类，其中N个组中的每一个只有一个向量出现。

举个例子，假设我们有3组向量：

{“ Hot Dog”，“ Hot sauce”，“ Hotshot”}
{“汉堡”，“汉堡”，“汉堡”}
{“披萨”，“比萨”，“广场”}

最佳聚类将是{“ Hot Dog”，“ Hamburger”，“ Pizza”}，因为根据某些函数我具有F（），这些向量在我定义的向量空间内彼此紧密聚类。 / p>

仅通过尝试每种组合，我就可以通过蛮力得出此结果。但是随着N和M的增长，这变得不可行。我可以使用动态编程方法吗？我可以查找任何参考算法吗？

谢谢。

编辑：

为澄清上述示例，每个字符串都像一个向量的ID，因此将其重新表述，组1为{v1，v2，v3}组2为{v4，v5，v6}，组3为{ v7，v8，v9}。

我希望的输出是{v1，v4，v7}，但采用非蛮力方式。

@ m69在下面的评论正确地描述了我所说的簇-一组向量，它们由某些函数 F（）计算的彼此之间的距离都在某个阈值t < / strong>。

0 个答案:

没有答案

相关问题

K意味着聚类超过500万个载体

在vc ++中组合两个向量的最佳方法

蛮力的最佳顺序解决了键盘代码锁定问题

最优网格聚类

计算向量矢量子集的最佳方法

对具有最小尺寸的组中的项目进行最佳分组/聚类

解决这个迷宫的最佳算法？

聚类和绘制单词向量 - python或R

解决词向量最佳聚类的算法

矩形聚类的最佳解决方案

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？