标签: python data-mining pca
我正在尝试在python中执行降维。我有文字及其频率计数。我希望通过对其进行降维来减少文本数量。例如,如果我有一个文本及其频率的文件,我如何减少python中的项目数?
答案 0 :(得分:0)
有很多方法可以降低维度。
如果没有正式的要求,很难推荐(另外,请先查看有关此问题的文献)。
在许多情况下,您可以随意删除维度。例如。 minhash以这种方式工作,以找到接近重复的文件。