结合Quanteda语料库时语料源的Docvar指标

时间:2018-07-28 21:47:11

标签: r quanteda

在结合Quanteda语料库(使用加号运算符)时,有什么方法可以自动创建一个指标变量,该变量可以标记文档来自哪个源语料库?例如,假设您有两个语料库,即 corpus1 corpus2 。您运行以下命令:

语料库3 <-语料库1 +语料库2

我想找到一种方法来创建一个新的docvar,以指示 corpus3 中每个文档来自哪个语料库。有什么想法吗?

1 个答案:

答案 0 :(得分:0)

目前尚无自动方法,但最简单的方法是在添加语料库之前创建语料库标识符。

str.match()