仅显示一个集群的数据

时间:2018-12-13 15:21:34

标签: python arrays pandas dataframe dbscan

我有一个熊猫数据框。

input_data = {'col1': [1, 2, 3], 'col2': [3, 4, 5]}
d = pd.DataFrame(data=input_data)

anotherdata= magic(d)
df = pd.DataFrame(data=anotherdata)

我使用DBSCAN对df进行集群。 结果,我有cluster_labels。在这种情况下,标签的值可以从-1(异常值)到2。

我希望有机会单独显示仅来自特定类的数据,并可以按索引访问初始数据帧d

例如,我在input_data中有一个索引为1的元素。 元素已分配给集群0,并且集群0没有其他元素。

如何通过索引在input_data中找到该元素?

1 个答案:

答案 0 :(得分:1)

您可能想使用

d[cluster_labels == 0]

除非您的magic函数更改了索引。