我正在尝试将pandas数据框中的列中的文本转换为英语,并将其部分转换为日语,将部分转换为英语。
我要翻译“说明”列
我正在使用以下代码来实现这一目标:-
raw_data_non_english ['translated_text_1'] = raw_data_non_english ['description']。apply(translator.translate,dest ='en')。apply(getattr,args =('text',))
我已经在Why is Google translator skipping some text in Python?
中描述了翻译问题问题的另一个例子是
string ='''危险物品的运输文件不完全Manipulace snebezpečnýmilátkami/přeprava(捷克共和国)Qn 2.71 kapitole 5.4 apožadovanoudokumentací,kterámábýtnaloženavpřepravníchjednotkách,jak je uvedeno včásti8,kapitola 8.1.2 dohody ADR。审查-危险产品的运输文件不完全'''
translator.translate(string).text
这会跳过输出中的许多文本。但是,如果我将字符串更改为多行字符串,以使其中一行完全是英语,而另一行是某种其他语言,如下所示,那么翻译就可以了。
string ='''危险物品运输文件不完全 Manipulace snebezpečnýmilátkami/přeprava (捷克共和国) QN 2.71JestližeZARIZENIodesílánebezpečnézbožíķpřepravěPO silnici,přepravazbožípodle ADR JEdoprovázenapřepravnímdokumentemnebezpečnéhozbožípředepsanýmv kapitole 5.4požadovanoudokumentací,kteráMA BYTnaloženavpřepravníchjednotkách,JAK JE uvedeno v CASTI 8,kapitola 8.1.2 dohody ADR。审查-危险产品的运输文件不完全'''
translator.translate(string).text
想要了解在翻译之前应如何将格式更改应用于列文本