我想从google plus社区页面中提取信息。 在json文件格式中,它可以帮助我分析一些社交行为。
实际上,在我分析了社区页面的html结构之后,我在开发者模式的chrome浏览器中尝试过它。
我希望以下列格式保存:
[ {author: "name", post: "post", comments: [{commentator: "cmm", comm: "comment"}]}]
我试过这个javascript:
// saving all the posts in the posts-array
var posts = document.getElementsByClassName("V2SCpf vCjazd")
var docLength = posts.length
var json = []
// pushing all the text in the json array
for(var i = 0; i < docLength; i++){
json.push(posts[i].innerText)
}
// new array for extracting
var newArray = new Array();
// getting the lines
for (var i = 0; i < json.length; i++) {
newArray[i] = json[i].split('\n');
}
for (var x = 0; x < docLength; x++){
for (var y = 0; y < newArray[x].length; y++){
let n = newArray[x][y]
if(n.length == 0){
continue;
} else {
newArray[x][y]
}
}
}
//looking for my data
newArray
当我使用保存功能时,我终于得到了类似的东西:
[
[
"",
"Authors name",
"Discussion",
"",
"",
"2h",
"Comment from author",
"oecd.org",
"no plus ones",
"no comments",
""
我的问题:如何将所有这些数据带入我的json文件格式? 谢谢。