我正在使用PDFTextStripper
从PDF中提取文本。
我想获取每个TextPosition
的宽度和高度(以毫米为单位)。可以使用tp.getWidth()从给定的TextPostion
tp中找到
tp.getHeight()。我的问题是返回的值在显示单位中。我试图四处寻找正确的转换因子,但感到困惑。我知道PDF使用不同的坐标系,如PDF documentation(下图)所述。
我也找到了这个post,但是由于我使用的是PDFBox 2.0.12,因此可能不推荐使用。这篇文章中描述的变量在 PDPage 类中不再存在,但是我在 PDRectangle 类
中找到了这些常量。/** user space units per inch */
private static final float POINTS_PER_INCH = 72;
/** user space units per millimeter */
private static final float POINTS_PER_MM = 1 / (10 * 2.54f) * POINTS_PER_INCH;
我的问题是:在哪个空间中定义显示单元?以及如何将其转换为军用限制器。
非常感谢,