我是R的新手,正在开展文本挖掘项目。我有所有的分析工作,但是当我将Term-Document Matrix转换回数据框时,它会在控制台中填充内容..
我使用的代码是:
TDM.frame <- data.frame(inspect(Words.TDM))
框架中有9k个对象,所以我也不会在这里粘贴它,但你可以想象控制台在整个内容转储时的样子^^
我尝试过使用隐形(),但这并没有改变任何东西。我希望有人可以告诉我我做错了什么,或提供解决方案!
谢谢!
答案 0 :(得分:2)
inspect()
中data.frame()
真的有必要吗?您是否可以将TDM转换为矩阵,因为这似乎是您要实现的目标?如有必要,您可以将矩阵转换为数据框。
as.matrix(Words.TDM)
答案 1 :(得分:2)
这是inspect
的作用(至少在给出TDM的情况下):
> tm:::inspect.TermDocumentMatrix
function (x)
{
print(x)
cat("\n")
print(as.matrix(x))
}
<environment: namespace:tm>
所以你想要返回的对象只是as.matrix(tdm)
并且你不想要打印副作用。所以你应该这样做:
TDM.frame <- data.frame(as.matrix(Words.TDM))
答案 2 :(得分:0)
尝试
TDM.frame <- data.frame(inspect(Words.TDM))
head(TDM.frame)
或者,您可以使用dplyr
library(dplyr)
TDM.frame <- tbl_df(TDM.frame)