你如何处理中间有印地语单词的英文文本? (R中的文本挖掘)

时间:2018-03-12 07:12:16

标签: r text-mining sentiment-analysis

我正在R中进行情绪分析,我正在寻找一种有效的方法来处理英语文本中的印地语单词。

例如:“我知道,这可能会发生魔法”

这里“magar”是印地语单词,意思是“但是”。如何处理用英语写的这种多语言文本?

谢谢!

1 个答案:

答案 0 :(得分:0)

您可以使用phonetic algorithm之类的soundex来处理词汇外的术语,并尝试将它们与印地语单词相匹配。然后你将这些独立单词翻译成英文。