我想对我正在构建的小应用程序使用潜在语义分析,但我不想自己构建矩阵。 (部分是因为我所拥有的文件不会成为一个非常好的培训集合,因为它们有点短而且异构,部分是因为我刚买了一台新电脑而且我觉得它是安装线性代数的婊子等等我需要的图书馆。)
是否有可用的“默认”/预构建LSA实现?例如,我正在寻找的东西包括:
答案 0 :(得分:2)
您可能对Python的Gensim框架感兴趣;值得注意的是,它有an example on building the appropriate matrices from English Wikipedia。