带有py_translator(google-translate)的JSONDecodeError:如何使该库适用于新的翻译?

时间:2018-11-19 21:05:29

标签: python pandas google-translate google-translation-api

我正在尝试使用Google Translate Api来转换我在数据框中转换的庞大kaggle csv中包含的文本。

我尝试使用googletrans,但出现此错误:

AttributeError: 'NoneType' object has no attribute 'group'

但这似乎是经常性错误,就像报告here一样。

我切换到也使用Google翻译的py_translator。刚开始时效果很好,我可以按照教程中的说明尝试类似这样的简单命令:

from py_translator import Translator
s = Translator().translate(text='Hello my friend', dest='es').text
print(s)

但是,在尝试将其应用于包含156 060行的数据框之后,由于我必须忘记了5K或15K的API限制,因此它完全停止了工作,并且我再也无法运行上面的代码,因为它总是会提高相同的错误:

JSONDecodeError: Expecting value: line 1 column 1 (char 0)

我遇到此错误之前使用的代码是:

df = pd.DataFrame(index=range(0,len(train)),columns=['translation'])
translator = Translator()
for i, row in enumerate(train['text']):
    df.loc[i,'translation'] = translator.translate(row,dest='Fr').text

遇到错误,但数据帧的第一行已正确转换。 但是,从那时起,我无法使用py_translator的任何功能获得任何结果,这可能是由于herehere建议的限制所致。

1)如何在简单的请求上重用py_translator转换,而不是一遍又一遍地重复使用以前曾经工作过的代码?

2)是否有更好的库或更好的方法转换大型数据集?

非常感谢

0 个答案:

没有答案