使用Javascript获取文章的标题/作者/日期信息

时间:2010-07-12 09:18:40

标签: javascript bookmarklet information-retrieval hcard data-scrubbing

我正在尝试构建一个bookmarklet,它将获取当前页面/文章的作者和日期信息,以供参考。我知道我可以使用document.title和document.URL获取页面标题和网址,但是当涉及到其他信息时,我正在画一个空白。有任何想法吗?

2 个答案:

答案 0 :(得分:2)

如果网站将此类信息放入META标记,您可以执行以下操作:

var author = "";
var info = document.getElementsByTagName('META');
for (var i=0;i<info.length;i++) {
  if (info[i].getAttribute('NAME').toLowerCase()=='author') {
    author = info[i].getAttribute('CONTENT');
  }
}

对于您在评论中提到的网站,您需要执行此非标准处理

  var author = "";
  var other = document.getElementsByTagName('li');
  for (var i=0;i<other.length;i++) {
    if (other[i].className.toLowerCase()=='author') author=other[i].getElementsByTagName('a')[0].innerHTML;
  }
  alert(author)
}

答案 1 :(得分:0)

HTML是否具有预定义格式?如果是,您可以解析HTML或查询DOM以获取您需要的其他信息。