我目前的项目涉及从PDF文档中提取有意义的信息。为了实现最终目标,我一直在尝试提取文本的前景。我从其中一个文档中提供了一个快照。
环绕文字的颜色为黑色。我怀疑我在某个地方出错了,但我确实从一些文件中获得了准确的文字颜色信息。
我已粘贴 LocationExtractionStrategy 派生的相关代码行:
public void RenderText(TextRenderInfo renderInfo)
{
iTextSharp.text.BaseColor colorStroke=renderInfo.GetStrokeColor();
iTextSharp.text.BaseColor colorFill = renderInfo.GetFillColor();
Color rgbFill=ConvertToRGB(colorFill);
Color rgbStroke=ConvertToRGB(colorStroke);
//rgbFill and rgbStroke turn[![enter image description here][2]][2] out to be black. Why?
}
private System.Drawing.Color ConvertToRGB(BaseColor colorIText)
{
if (colorIText == null) return System.Drawing.Color.Black;
var col = System.Drawing.Color.FromArgb(colorIText.R, colorIText.G, colorIText.B);
return col;
}