我想打开PDF文件并检查页面方向。没有其他的。有没有快速的方法来使用c ++或python?
我不想为此使用任何外部库。
答案 0 :(得分:3)
不使用预先存在的PDF处理库?没有什么“快速”或“轻松”的。
至少,你必须能够阅读和解析PDF页面树,这反过来又要求你阅读和解析PDF Object 树(可以多次压缩和更新) )。
扫描页面树时,您可能会发现页面被旋转和/或具有指示它们比它们更宽的尺寸,或者相反(通常定义为“纵向”和“横向”)。当然,页面的大小可以横向定义,但可以旋转90度或270度。
但它比那更复杂!页面旋转或尺寸未定义方向;最终,该页面上的 text 定义了它。假设页面具有纵向尺寸且不旋转;然而,完全有可能将其所有内容(文本和图形)旋转 - 左侧或右侧,颠倒或任何其他角度。
此外,对于为书籍或期刊设计的PDF,通常会在页面和/或页脚处于“常规”位置时看到一个直立的页面,并且内容(如宽桌子)会旋转。 / p>
..当然,自己写这些都是非常有趣的。官方PDF规范包含足够的信息来帮助您入门;见PDF specifications for coders: Adobe or ISO?。请务必留出足够的时间阅读所有内容。