ASP.net - 输入字符串的格式不正确。对于HTMLWorker.ParseToList

时间:2014-01-06 09:52:07

标签: html asp.net html-parsing itextsharp

我正在使用

  

HTMLWorker.ParseToList(New StringReader(HTMLCode),New StyleSheet)

在包含以下内容的字符串 HTMLCode

  <html>
    <body>
    <table width="auto;">  
        <tr style="color:white ; background: #336699; font-style:bold;">
        <th width="257px;" height="40" >Service Name</th>
        <th width="100px;" height="40">Hits </th>
        <th width="100px;" height="40">Revenue</th>
        <th width="100px;" height="40">Service Cost</th>
        </tr>

        <tr>  
        <td width="257px;" height="30" >  GtalkDay </td> 
        <td width="257px;" height="30" > 320 </td> 
        <td width="257px;" height="30" >  67.20 </td> 
        <td width="257px;" height="30" >  (0.21 K) </td>
        </tr>

        <tr style="background: #EBEBE0">  
        <td width="257px;" height="30" >  TwitterDay </td> 
        <td width="257px;" height="30" > 885 </td> 
        <td width="257px;" height="30" >  185.85 </td> 
        <td width="257px;" height="30" >  (0.21 K) </td>
        </tr>

        <tr>  
        <td width="257px;" height="30" >  YahooDay </td> 
        <td width="257px;" height="30" > 626 </td> 
        <td width="257px;" height="30" >  131.46 </td> 
        <td width="257px;" height="30" >  (0.21 K) </td>
        </tr> 

        </table>
    </body>
    </html>

它正在返回错误:

  

输入字符串的格式不正确。

可能是什么问题? HTML代码看起来非常好。

所有帮助将不胜感激

PS:我尝试删除宽度和高度以及背景属性,并且解析工作正常

1 个答案:

答案 0 :(得分:2)

这可能是由于HTML格式不正确。

您应该在HTML标记的结束标记之前删除空格,如下所示:

更改此内容,

<td width="257px;" height="30" >  GtalkDay </td>

<td width="257px;" height="30">GtalkDay</td>