使用R中的tm包DatasourceFrame选项读取csv文件时遇到问题

时间:2019-09-24 15:46:40

标签: r csv dataframe tm

我需要知道如何设置一个csv文件,以便可以使用带有tm包的DataframeSource选项加载它

我有一个现有的csv文件“ practic.orig”,我想使用tm包将其转换为语料库。我可以成功将其作为数据帧加载,但是一旦尝试使用DataframeSource选项将其转换为语料库,我就会收到一条错误消息。我知道此选项需要将前两列分别命名为“ doc_id”和“ text”。基于错误,我怀疑问题出在我的csv文档中的列名-我将excel中的默认列名从“ A”和“ B”更改了,但是一旦我将文档另存为csv文件,任何名称都会更改对列标题所做的将被删除。

tmd1 <- data.frame("practice.orig")
ex_data_tm1 <- DataframeSource(tmd1)
Error in DataframeSource(tmd1) : 
  all(!is.na(match(c("doc_id", "text"), names(x)))) is not TRUE

0 个答案:

没有答案