如何使用CasperJS将html数据表解析/映射到JSON对象

How to parse/map an html data table to a JSON object using CasperJS?

本文关键字:映射 JSON 对象 CasperJS 何使用 html 数据表      更新时间:2023-09-26

如果我有一个包含多行和多列的表,如:

<tr>
  <td></td>
  <td><input class="chkdummyclass" id="105" name="checkBox" type="checkbox"
  value="true"><input name="checkBox" type="hidden" value="false"></td>
  <td>94</td>
  <td></td>
  <td>3VW637AJ3VINNUMBEr</td>
  <td>Used</td>
  <td>2014</td>
  <td>Volkswagen</td>
  <td>Jetta Sedan</td>
  <td>Trendline/Comfortline/Highline</td>
  <td>4dr Hybrid TSI DSG Trendline</td>
  <td></td>
  <td class="rightAlign">0</td>
  <td class="rightAlign">
    $22,919.00
  </td>
  <td class="rightAlign">$11,999.00</td>
  <td>Available</td>
  <td>
    0
  </td>
  <td>
    <a href="javascript:;" onclick=
    "javascript:GetVehicleImages(105,0);">0/20</a>
  </td>
  <td class="centerAlign"><img src=
  "/inventory/Configured.png"></td>
</tr>

我有点困惑于我应该使用什么CasperJS工具,因为我很确定我不能加载任何类型的解析器或jQuery。我想最终得到一个JSON对象,我可以将其发布到一个位置,有点像这样:

{
  'vin': '3VW637AJ3VINNUMBEr',
  'make': 'Volkswagen',
  'year': 2014
 // etc
}

如何在CasperJS中执行此操作?

CasperJS在这里没有提供太多帮助。你需要自己穿过这棵树。DOM函数非常强大,这是一件好事。你需要在页面上下文中这样做:

casper.then(function(){
    var info = this.evaluate(function(){
        var table_rows = document.querySelectorAll("tr"); //or better selector
        return Array.prototype.map.call(table_rows, function(tr){
            return {
                vin: tr.children[4].textContent,
                make: tr.children[7].textContent,
                year: tr.children[6].textContent
            };
        });
    });
    this.echo(JSON.stringify(info, undefined, 4));
});