使用Quanteda从文件名中读取docvars

时间:2017-04-06 17:45:22

标签: r text quanteda

quanteda的文档说这是从文件夹导入文本文件并从文件名中读取元数据的方法:

require(readtext)
mytf5 <- readtext("directory/*.txt",docvarsfrom="filenames", sep="-", docvarnames=c("Year", "President"))

我在目录中有这些文件:

[1] "1866-marx.txt"     "1910-weber.txt"    "1958-williams.txt"
[4] "1982-bell.txt"     "1998-lindgren.txt"

使用上面的代码时,我得到:

Error in file(f, ...) : unused argument (sep = "-")

尽管我有&#34; - &#34;文件名中的分隔符。

1 个答案:

答案 0 :(得分:1)

您在技术上使用 readtext 包,而不是 quanteda ,而我们即将提交 readtext 到CRAN,它& #39; s仍然只在GitHub上。我不确定您使用的是哪个版本,但语法错误。这是正确的电话:

require(readtext)
mytf5 <- readtext("directory/*.txt", docvarsfrom = "filenames", dvsep="-",
                  docvarnames = c("Year", "President"))

所以:你需要的命令是:

{{1}}