如何提取unicode不支持的字符?

时间:2019-06-19 11:35:14

标签: python unicode apache-tika

我正在尝试使用Tika-App 1.21从PDF中提取文本。 在提取时,发现PDF中的某些字符没有unicode映射。有什么办法可以找到Unicode中的等效字符?

0 个答案:

没有答案