我还是NLP(自然语言处理)的新手。我必须创建一个包含TAGLISHUANO(Tagalog-Cebuano-English)单词的字典。我真的很难使用API和模块检测这些语言。另外,我需要将Cebuano和他加禄语翻译成英文以便于使用。有什么办法吗?
我已经尝试过googletrans
,但是每天最多只能使用15,000个字符。我也尝试过langdetect
,但是每次运行时,它都不会产生期望的输出。例如:detect(“ kwarto”),输出是(so),但据推测它必须是tl(菲律宾)。我已阅读过有关Google云翻译的信息,但我认为您需要为此付费?另外,我不知道如何使用网址进行检测和翻译。请多多包涵,我还是Python和NLP的新手。
我已经从googletrans尝试过此操作
translator = Translator()
tweets = translator.translate(["dagat", "car", "kwarto"])
for i in tweets:
print(i.text)
但是,经过多次尝试后,它将引发JSONDecodeError。检测语言时也是如此。
我有一个包含6万个单词的列表-英语,宿雾语和他加禄语的混合物。我只想过滤掉这三种语言,并将其放入带有英语,塔加拉族语和宿雾语列的csv中。这样做之后,我需要翻译他加禄语和宿雾语。