我正在研究2 pdf比较第一次我提取PDF以获得PDF样式.PDF样式被提取并转换为html。然后我最后比较了2个HTML文本。
对于PDF提取,我使用了itextsharp
这是代码
this.result.AppendFormat(
"<tr><td>{0}</td><td>{1}</td><td>{2}pt</td><td>{3}</td><td>{4}</td><td>",
Form1.j, curFont, font_size_client, fontweight, fontstyle);
}
this.result.Append(renderInfo.GetText());
}
public string GetResultantText()
{
if (result.Length > 0)
{
result.Append("<tr><td></td><td></td>");
}
return result.ToString();
}
这是我用于转换的代码。我的问题是一个示例PDF我使用HTML文本本身来比较文本。在HTMLbook中有一些样式,如背景颜色,fontsize附加到文本。它取代了文字风格。你能告诉我如何提取风格吗?是我选择比较2 PDF的方法是错误的。或任何其他方法。
答案 0 :(得分:0)