如何使用适当的解码方法将格鲁吉亚语言pdf文本解码为csv?

时间:2019-04-02 08:12:56

标签: pdf google-translate xpdf

我们有100多种使用“乔治亚州”语言的pdf。我们已将这些pdf表中的表格提取并保存为csv(使用Camelot Python Table Extraction库)。但是它们的语言完全不同。

enter image description here

我已经使用xpdf检查了pdf中嵌入的字体

enter image description here

我正在尝试使用“ googletrans”将那些csv从格鲁吉亚语翻译为英语。但是不知道如何进行“ 编码 ”。我是否必须以其他某种格式保存(编码)所有的csv?

0 个答案:

没有答案