按特定元素名称删除数据 - PhantomJS

时间:2017-04-14 10:08:51

标签: javascript web-scraping phantomjs

我正在使用PhantomJS从twitter页面中提取一些数据。以下是我要废弃的示例内容:

<span class="ProfileTweet-action--reply u-hiddenVisually">
  <span class="ProfileTweet-actionCount"  data-tweet-stat-count="541">
    <span class="ProfileTweet-actionCountForAria" data-aria-label-part>541 replies .</span>
  </span>
</span>

这是我获取回复计数的代码:

var replyCount = page.evaluate(function(){
 return document.getElementsByClassName("ProfileTweet-action--reply");
});
for (var i = 0; i < replyCount.length; i++) {
    var replyInt = replyCount[i].innerText;
    console.log(replyInt);
}

输出为541 replies

有没有办法取消data-tweet-stat-count的价值,所以我可以获得“541”?

该页面中还有其他名称为data-tweet-stat-count的元素。任何人都可以引导我吗?

1 个答案:

答案 0 :(得分:1)

var replyCount = page.evaluate(function(){
    return document.querySelector('span.ProfileTweet-action--reply span.ProfileTweet-actionCount').getAttribute('data-tweet-stat-count');
});