标签: python deep-learning computer-vision
我需要仅从pdf中提取文本,而忽略表格格式的任何内容。我在网上进行了很多搜索,发现了一些可以识别表格的工具(例如表格,骆驼等工具) 我需要忽略pdf文档中的任何表格结构,而仅包含段落文本。