我已经完成了针对毁林的矿山群集补丁数据集的DBSCAN运行,并且我尝试根据this paper.
验证结果我已经从Github,安装了软件包,但是当我尝试运行代码时,它永远不会完成。我运行了超过5天,它从未停止运行或引发错误。运行DBSCAN仅花费了15分钟,所以我有点困惑为什么仅验证花费了这么长时间。我的DBCV代码或输入内容有问题吗?
由于它永远不会完成运行代码,因此我不知道可以报告的错误。我不确定是否将数据正确输入到代码中,但是我试图尽可能地在GitHub上复制示例。我不知道如何共享我的.csv文件以显示我的文件的样子。它具有16个尺寸,我在运行DBSCAN之前使用MinMaxScaler进行了精简。我之前已经完成了DBSCAN集群,并且刚刚尝试使DBCV正常工作。
import pandas as pd
import numpy as np
from pylab import rcParams
import matplotlib.pyplot as plot
import sklearn
from sklearn.cluster import DBSCAN
from sklearn.preprocessing import MinMaxScaler
from scipy.spatial import euclidean
from DBCV import DBCV
f = pd.read_csv('csv_file_I_Don't_know_how_to_share')
x = f.loc[:, [1-15]].values
norm_data = MinMaxScaler()
data = norm_data.fit_transform(x)
dbscan = DBSCAN(eps=.15, min_samples = 100)
clusters = dbscan.fit_predict(data)
DBCV_score = DBCV(data, clusters, dist_function=euclidean)
print ('DBCV Score: ' + DBCV_score)
我希望可以打印一个乐谱,但是代码会继续运行并且不会停止。任何帮助都会很棒!