我列出了一个非常大的列表twitter
。每个顶级子列表twitter[[i]]
都是针对每条推文制作的。但是并非每个顶级子列表都具有相同的结构,其中一些可能没有特定的插槽。如何将此类列表转换为数据框,其中每行包含每条推文的信息,并使用NA
来弥补缺失的信息。
让我们以twitter[[10101]]
(已编辑)为例:
> str(twitter[[10101]])
$ retweeted : logi FALSE
$ text : chr "RT @TeriChristoph: W-T-H??? 'Rep. Speier: \030Women Will Attain The Position of First Class Citizens\031 Under Obamacare' http:"| __truncated__
$ id_str : chr "182608843031842816"
$ source : chr "<a href=\"http://www.tweetdeck.com\" rel=\"nofollow\">TweetDeck</a>"
$ entities :List of 3
..$ urls :List of 1
.. ..$ :List of 4
.. .. ..$ indices : num [1:2] 116 136
.. .. ..$ display_url : chr "shar.es/p4fyt"
.. .. ..$ url : chr "http://t.co/T62gHwaE"
.. .. ..$ expanded_url: chr "http://shar.es/p4fyt"
..$ user_mentions:List of 1
.. ..$ :List of 5
.. .. ..$ id_str : chr "15932085"
.. .. ..$ screen_name: chr "TeriChristoph"
.. .. ..$ name : chr "Teri Christoph"
.. .. ..$ id : num 15932085
..$ hashtags : list()
.. ..- attr(*, "class")= chr "AsIs"
$ favorited : logi FALSE
$ contributors : NULL
$ place : NULL
$ created_at : chr "Wed Mar 21 23:25:15 +0000 2012
$ geo : NULL
$ user :List of 38
..$ is_translator : logi FALSE
..$ show_all_inline_media : logi FALSE
..$ profile_link_color : chr "9D582E"
..$ id_str : chr "16504112"
..$ name : chr "Sheryl"
$ id : num 1.83e+17
$ truncated : logi FALSE