我有一个熊猫数据框。
input_data = {'col1': [1, 2, 3], 'col2': [3, 4, 5]}
d = pd.DataFrame(data=input_data)
anotherdata= magic(d)
df = pd.DataFrame(data=anotherdata)
我使用DBSCAN对df
进行集群。
结果,我有cluster_labels
。在这种情况下,标签的值可以从-1(异常值)到2。
我希望有机会单独显示仅来自特定类的数据,并可以按索引访问初始数据帧d
。
例如,我在input_data
中有一个索引为1的元素。
元素已分配给集群0,并且集群0没有其他元素。
如何通过索引在input_data
中找到该元素?
答案 0 :(得分:1)
您可能想使用
d[cluster_labels == 0]
除非您的magic
函数更改了索引。