标签: r quanteda
在结合Quanteda语料库(使用加号运算符)时,有什么方法可以自动创建一个指标变量,该变量可以标记文档来自哪个源语料库?例如,假设您有两个语料库,即 corpus1 和 corpus2 。您运行以下命令:
语料库3 <-语料库1 +语料库2
我想找到一种方法来创建一个新的docvar,以指示 corpus3 中每个文档来自哪个语料库。有什么想法吗?
答案 0 :(得分:0)
目前尚无自动方法,但最简单的方法是在添加语料库之前创建语料库标识符。
str.match()