标签: python unicode apache-tika
我正在尝试使用Tika-App 1.21从PDF中提取文本。 在提取时,发现PDF中的某些字符没有unicode映射。有什么办法可以找到Unicode中的等效字符?