标签: pdf pdfbox xpdf
有没有办法解析pdf内容流并识别段落边界?我读过ISO 32000-1:2008但是无法理解,pdf内容流是否包含告诉显示软件启动段落或结束它的任何操作符。任何文本提取器软件(例如pdfbox或xpdf)都可以提供该信息吗?
pdfbox
xpdf