将数据/信息从Google +社区页面提取到json文件

时间:2017-09-21 18:00:19

标签: javascript json google-chrome google-plus information-extraction

我想从google plus社区页面中提取信息。 在json文件格式中,它可以帮助我分析一些社交行为。

实际上,在我分析了社区页面的html结构之后,我在开发者模式的chrome浏览器中尝试过它。

我希望以下列格式保存:

[ {author: "name", post: "post", comments: [{commentator: "cmm", comm: "comment"}]}]

我试过这个javascript:

        // saving all the posts in the posts-array
    var posts = document.getElementsByClassName("V2SCpf vCjazd")
    var docLength = posts.length

    var json = []

    // pushing all the text in the json array
    for(var i = 0; i < docLength; i++){
        json.push(posts[i].innerText)
    }

    // new array for extracting
    var newArray = new Array();

    // getting the lines
    for (var i = 0; i < json.length; i++) { 
        newArray[i] = json[i].split('\n'); 
    } 

    for (var x = 0; x < docLength; x++){
        for (var y = 0; y < newArray[x].length; y++){

            let n = newArray[x][y]

            if(n.length == 0){
               continue;      
            } else {
                newArray[x][y]
            }
        }
    }

//looking for my data
    newArray

当我使用保存功能时,我终于得到了类似的东西:

[
    [
        "",
        "Authors name",
        "Discussion",
        "",
        "",
        "2h",
        "Comment from author",
        "oecd.org",
        "no plus ones",
        "no comments",
        ""

我的问题:如何将所有这些数据带入我的json文件格式? 谢谢。

0 个答案:

没有答案