两个HTML的比较

时间:2013-06-04 05:09:57

标签: c# html visual-studio-2010 itextsharp

我正在研究2 pdf比较第一次我提取PDF以获得PDF样式.PDF样式被提取并转换为html。然后我最后比较了2个HTML文本。

对于PDF提取,我使用了itextsharp

这是代码

  this.result.AppendFormat(
     "<tr><td>{0}</td><td>{1}</td><td>{2}pt</td><td>{3}</td><td>{4}</td><td>", 
    Form1.j, curFont, font_size_client, fontweight, fontstyle);
        }
  this.result.Append(renderInfo.GetText());
        }

  public string GetResultantText()
  {
      if (result.Length > 0)
      {
          result.Append("<tr><td></td><td></td>");
      }
      return result.ToString();
  }

这是我用于转换的代码。我的问题是一个示例PDF我使用HTML文本本身来比较文本。在HTMLbook中有一些样式,如背景颜色,fontsize附加到文本。它取代了文字风格。你能告诉我如何提取风格吗?是我选择比较2 PDF的方法是错误的。或任何其他方法。

1 个答案:

答案 0 :(得分:0)

将其解压缩为HTML后,您可以使用jQuery获取.HTML()代码。

看看这里:https://api.jquery.com/html/

之后你可以比较两个结果。