R语料库中的子语言

时间:2016-11-27 12:34:52

标签: r tm

我下载了this one等文件以放入语料库,其中包括

等文字
  

“Deutscher Bundestag”

     

Stenografischer Bericht

     
      
  1. Sitzung
  2.         

    Berlin,Freitag,den 11. November 2016

         

    Inhalt

         

    Tagesordnungspunkt 36:   Dritte Beratung des von der Bundesregierung eingebrachten Entwurfs eines Vierten GesetzeszurÄnderungarzneimittelrechtlicherund anderer Vorschriften   Drucksachen 18 / 8034,18 / 8333,18 / 8461 Nr。 1.5,18 / 10280,18 / 10056

         

    PräsidentNorbertLammert博士:Nehmen Sie bitte Platz。死Sitzung   isteröffnet。 Liebe Kolleginnen und Kollegen,ichbeadrüßeSie“

我希望在议会辩论开始之前切断所有文本。

如果我这样做

test <- c("text from above")
test <- sub(".*Die Sitzung ist eröffnet\\.","",test)

这有效,但如果我使用

for (j in seq(test))
{
  test[[j]] <- sub(".*Die Sitzung ist eröffnet\\.","",test[[j]])

}

对于语料库我没有任何改变。非常感谢帮助,谢谢!

0 个答案:

没有答案