从 CasperJS 中的嵌套 JavaScript 对象获取值

Get value from nested JavaScript object in CasperJS

本文关键字:对象 获取 JavaScript 嵌套 CasperJS      更新时间:2023-09-26

我正在尝试深入研究嵌套的javascript数组来获取对象的第一个实例。代码如下:

var utils = require('utils');
var casper = require('casper').create();
casper.start('http://en.wikipedia.org/wiki/List_of_male_tennis_players', function() {
  this.echo(this.getTitle());
  // Get info on all elements matching this CSS selector
  var tennis_info_text = this.evaluate(function() {
    var nodes = document.querySelectorAll('table.sortable.wikitable tbody tr');
    return [].map.call(nodes, function(node) { // Alternatively: return Array.prototype.map.call(...
      return node.textContent;
    });
  });
  // Split the array into an array of object literals
  var tennis_data = tennis_info_text.map(function(str) {
    var elements = str.split("'n");
    var data = {
      name       : elements[1],
      birth      : elements[2],
      death      : elements[3],
      country    : elements[4]
    };
    return data;
  });
  // Dump the tennis_names array to screen
  utils.dump(tennis_data.slice(1,5));
});
casper.run();

stdout 的结果是这样的:

{
    "name": "Acasuso, JoséJosé Acasuso",
    "birth": "1982",
    "death": "–",
    "country": " Argentina"
},
{
    "name": "Adams, DavidDavid Adams",
    "birth": "1970",
    "death": "–",
    "country": " South Africa"
},...

对于 name 元素,我从tr行中获取所有内容,当您查看目标 url 源时,该行与 2 个元素匹配。我想要的只是带有类"fn"的 name 元素的第二部分;例如:"大卫·亚当斯"、"何塞·阿卡苏索"。我认为像name:elements[1].smtg这样的东西应该有效,但我没有运气。

此外,如何从elements对象打印可用的对象键?

问题是第一个单元格包含两个元素,其中包含具有不同顺序的玩家的姓名和名字。当取整个单元格的textContent时,两个名称表示形式都放入同一个字符串中,但在浏览器中只有一个是可见的。如果您只想访问可见的,则需要显式爬网它。

您可以编写一个自定义函数来从字符串中删除重复的名称,但是仅获取正确元素的textContent会更容易。

这可以在页面上下文中轻松完成:

var tennis_data = this.evaluate(function() {
    var nodes = document.querySelectorAll('table.sortable.wikitable tbody tr');
    return [].map.call(nodes, function(node) {
        var cells = [].map.call(node.querySelectorAll("td"), function(cell, i){
            if (i === 0) {
                return cell.querySelector(".fn").textContent;
            } else {
                return cell.textContent;
            }
        });
        return {
            name: cells[0],
            birth: cells[1],
            ...
        }
    });
});

此外,如何打印elements对象的可用对象键?

elements是一个字符串数组,因此除了数组索引和数组函数之外,没有可以访问的键。