Treetag包koRpus R.

时间:2017-03-15 14:26:45

标签: r lemmatization treetagger korpus

首先,我很抱歉我的英语,我说英语非常糟糕。

所以,我对R上的koRpus包中的treetag函数有疑问。 我想把文本搞得一团糟,Treetagger对我来说没问题。 我使用了treetag函数:

treetag(file, treetagger = "manual", lang = "fr",
        TT.options = list(path, preset="fr")) 

我获得了代币,标签......

但是在这个词形还原化之后,我想获得标记文本,而我没有解决方法来做到这一点。我想用我的文字替换每个标记。

那么,你有解决方案吗?

非常感谢!

1 个答案:

答案 0 :(得分:1)

Proof next steps:

txt1 <- treetag(c(“played”, “saw”),
treetagger=”manual”, lang=”en”,
encoding = “UTF-8″,
TT.options=list(path=”C:/TreeTagger”, preset=”en”),
format = “obj”)

text2 <- slot(txt1 , "TT.res")

text3<- ifelse(text2$lemma == "<unknown>", text2 $token, 
                           text2$lemma)