XML到CSV转换:不了解HTML字符和其他特殊字符

时间:2013-10-17 18:19:38

标签: java html xml csv sax

我发现此代码可以在java中将任何XML转换为CSV。除了一些例外,代码工作得非常好。这是代码: Convert XML file to CSV in java

我的xml包含很少的特殊字符和html数据。我的xml中的一个标签的示例如下所示:

<html-rem-string1>
    <tr>
        <td style="background-color:#f0ebeb;">Feline Rabies Vaccination, 1yr </td>
        <td style="font-weight: bold; color:#cc0000; background-color:#f0ebeb;">6/27/2013
        </td>
    </tr>
</html-rem-string1>

现在每当我尝试转换它时,我都会得到不寻常的结果。 我的理解是它不理解HTML标签和特殊字符(我真的不知道两个对不起的区别)。

有人知道如何在我的csv中获得完全相同的值。

感谢。

1 个答案:

答案 0 :(得分:1)

你应该使用HTML解析器,例如。 this one。另请查看this question