我试着像这样标记一个句子向量:
tok <- tokenize_sentences(tolower(SnowballC::wordStem(IRC, language = 'fr')))
我得到了这个结果样本:
....
[[995]]
[1] "aucun dialogue j'envoie des fax ...."
[[996]]
[1] "je trouve ...pour 1 jour..."
[[997]]
[1] "satisf"
[[998]]
[1] "bon contact ..."
...
我想知道是否有任何方法可以将其转换为:
....
[995]
"aucun dialogue j'envoie des fax ...."
[996]
"je trouve ...pour 1 jour..."
[997]
"satisf"
[998]
"bon contact ..."
...
谢谢