首先,我很抱歉我的英语,我说英语非常糟糕。
所以,我对R上的koRpus包中的treetag函数有疑问。 我想把文本搞得一团糟,Treetagger对我来说没问题。 我使用了treetag函数:
treetag(file, treetagger = "manual", lang = "fr",
TT.options = list(path, preset="fr"))
我获得了代币,标签......
但是在这个词形还原化之后,我想获得标记文本,而我没有解决方法来做到这一点。我想用我的文字替换每个标记。
那么,你有解决方案吗?
非常感谢!
答案 0 :(得分:1)
Proof next steps:
txt1 <- treetag(c(“played”, “saw”),
treetagger=”manual”, lang=”en”,
encoding = “UTF-8″,
TT.options=list(path=”C:/TreeTagger”, preset=”en”),
format = “obj”)
text2 <- slot(txt1 , "TT.res")
text3<- ifelse(text2$lemma == "<unknown>", text2 $token,
text2$lemma)