我使用tm
包创建文档语料库,我想使用谱聚类(kernlab
包)进行文本分类。
所以,如果我有一个语料库
my_corpus = VCorpus(DirSource(directory="C:/Users/me/Desktop/Documents", pattern="txt")
我想使用specc
函数执行谱聚类,该函数采用以下参数
specc(x, centers, kernel)
我把第一个论点放在哪里?文档说x必须是“要聚类的数据矩阵,或者要拟合的模型的符号描述,或类kernelMatrix的内核矩阵,或者字符向量列表”。但只是放my_corpus
不起作用。所以如果你有一套文件,我很困惑。
答案 0 :(得分:0)
选择合适的内核
计算内核矩阵
光谱聚类
评估,评估,评估。聚类可能会失败,但仍会产生结果。在文本上,任何结果都可以被解释为看起来很好......请参阅有关主题建模的两篇出版物,阅读茶叶和#34;在标题中!
答案 1 :(得分:0)
x需要矩阵或数据帧。如果他们的话,语料库也不是。您应该将语料库转换为文档术语矩阵,然后将其转换为矩阵格式。