比方说,我可以用1000种不同的方式定义一个人,所以我有一个特定人的1000个特征。
问题:如果有1,000个功能,我如何运行机器学习算法来确定最佳匹配,或最近/最相似的人?
我尝试了 Kmeans ,但这似乎更多是2个功能,而不是高维度。
答案 0 :(得分:3)
你基本上是在某种K Nearest Neighbors Algorithm之后 由于您的数据具有较高的维度,因此您应该浏览以下内容:
答案 1 :(得分:1)
您可以尝试直接应用距离指标(例如cosine similarity)。
如果你知道这些人有多相似,你可以尝试以下方法:
请参阅neuralnetworksanddeeplearning.com以获取精彩的介绍,并Keras查看简单的框架
更高级的方法称为度量学习。
对于培训,您必须首先在网络上提供网络,存储结果,然后存储第二个人,存储结果,应用您选择的距离度量(例如欧几里德距离),然后反向传播错误