标签: python pypdf2 rasa-nlu
我正在尝试使用pdf2text从Python中的pdf中提取文本,但是由于pdf布局,我无法分离列。
pdf2text
将pdf转换为文本时,得到以下输出:
北Tryon街列克星敦大街 北卡罗来纳州夏洛特28200纽约,纽约10001 美国美国
北Tryon街列克星敦大街
北卡罗来纳州夏洛特28200纽约,纽约10001
美国美国
将pdf转换为文本时如何分隔列?