如何使用CasperJS将html数据表解析/映射到JSON对象?

时间:2015-12-13 02:04:06

标签: javascript jquery html css-selectors casperjs

如果我有一个包含多行和多列的表,请执行以下操作:

<tr>
  <td></td>
  <td><input class="chkdummyclass" id="105" name="checkBox" type="checkbox"
  value="true"><input name="checkBox" type="hidden" value="false"></td>
  <td>94</td>
  <td></td>
  <td>3VW637AJ3VINNUMBEr</td>
  <td>Used</td>
  <td>2014</td>
  <td>Volkswagen</td>
  <td>Jetta Sedan</td>
  <td>Trendline/Comfortline/Highline</td>
  <td>4dr Hybrid TSI DSG Trendline</td>
  <td></td>
  <td class="rightAlign">0</td>
  <td class="rightAlign">
    $22,919.00
  </td>
  <td class="rightAlign">$11,999.00</td>
  <td>Available</td>
  <td>
    0
  </td>
  <td>
    <a href="javascript:;" onclick=
    "javascript:GetVehicleImages(105,0);">0/20</a>
  </td>
  <td class="centerAlign"><img src=
  "/inventory/Configured.png"></td>
</tr>

我有点难以理解我应该使用的CasperJS工具,因为我非常确定我无法加载任何类型的解析器或jQuery。我想最终得到一个JSON对象,我可以POST到一个位置,有点像这样:

{
  'vin': '3VW637AJ3VINNUMBEr',
  'make': 'Volkswagen',
  'year': 2014
 // etc
}

我如何在CasperJS中执行此操作?

1 个答案:

答案 0 :(得分:4)

CasperJS在这里没有提供太多帮助。您需要自己遍历树。 DOM功能非常强大,这是一件好事。您需要在页面上下文中执行此操作:

casper.then(function(){
    var info = this.evaluate(function(){
        var table_rows = document.querySelectorAll("tr"); //or better selector

        return Array.prototype.map.call(table_rows, function(tr){
            return {
                vin: tr.children[4].textContent,
                make: tr.children[7].textContent,
                year: tr.children[6].textContent
            };
        });
    });
    this.echo(JSON.stringify(info, undefined, 4));
});