当我使用itextsharp提取文本时,我将获得文本的x和y坐标。通过使用这两个坐标,如果我将文本从pdf转换为html基于x y位置文本位置chnages。得到我用的x,y坐标
Vector curBaseline = renderInfo.GetBaseline()。GetStartPoint();
float x = curBaseline [Vector.I1];
float y = curBaseline [Vector.I2];
例如:当我使用上述方法提取文本时,例如x = 42和y = 659;
答案 0 :(得分:4)
张贴为答案......
如果我没记错的话,PDF会使用一个坐标系,它从页面底部的左角开始,而不是在顶部。所以当你在html中直接使用它时,每个coordiante都是错误的。您必须转换值。
你的pdf文档应该有类似document.actualheight的内容,只需从中减去你的价值....