R中的NMi和Jaccard测量

时间:2018-04-02 02:13:40

标签: r

我正在尝试使用NMI包和R的集群包从R中找到jaccard和NMI索引。因为主要数据包含3个集群,所以我得到错误的索引,而测试数据分别有5个集群和2个集群。有没有办法可以正确计算NMI和jaccard索引这样的数据。以下是我目前正在使用的代码

 [
    {
        "id": 3,
        "author": "",
        "title": "Fancy Meat",
        "content": "Strip steak bresaola capicola tail cow chicken corned beef turkey.",
        "tags": ["test", "lorum"],
        "categories": ["blah"],
        "publishDate": "2018-02-12T08:15:00.000-05:00",
        "published": true
    },
]

和NMI

clarax <- clara(a,3)
clV1 <- clarax$clustering
clara1 <- clara(e,5)
clV2 <- clara1$clustering 
ci <- cindex(clV1=clV1, clV2=clV2, self=FALSE, minSZ=1, method="jaccard")
ci[2:3] # Returns Jaccard index and variables used to compute it 
ci$intersects
a4<-ci$Jaccard_Index
sprintf("%.16f", a4)

clarax <- clara(a,3)
clV1 <- clarax$clustering
clara1 <- clara(f,2)
clV2 <- clara1$clustering 
ci <- cindex(clV1=clV1, clV2=clV2, self=TRUE, minSZ=1, method="jaccard")
ci[2:3] # Returns Jaccard index and variables used to compute it 
ci$intersects
a5<-ci$Jaccard_Index
sprintf("%.16f", a5)

这是指向数据集的链接

b4<-NMI(groundtruth,clustering_4)
sprintf("%.16f", b4)

分区数据集是主要数据集,我们必须根据这些值找到索引。

请帮帮我 此致

1 个答案:

答案 0 :(得分:0)

我真的没有在这里看到问题。 NMI不需要相同数量的集群。使用NMI包(因为我不清楚你在问题中使用的内容),它就像这样简单:

public void onServiceConnected(ComponentName className,
                                           IBinder service) {
  ((YourApplication)getApplication()).getServiceManager().bind(service);
}