如何将一个大的不等嵌套列表转换为R中的data.frame / datatable

时间:2015-09-28 01:02:15

标签: r dataframe

我列出了一个非常大的列表twitter。每个顶级子列表twitter[[i]]都是针对每条推文制作的。但是并非每个顶级子列表都具有相同的结构,其中一些可能没有特定的插槽。如何将此类列表转换为数据框,其中每行包含每条推文的信息,并使用NA来弥补缺失的信息。

让我们以twitter[[10101]](已编辑)为例:

 > str(twitter[[10101]])
 $ retweeted                  : logi FALSE
 $ text                       : chr "RT @TeriChristoph: W-T-H??? 'Rep. Speier: \030Women Will Attain The Position of First Class Citizens\031 Under Obamacare' http:"| __truncated__
 $ id_str                     : chr "182608843031842816"
 $ source                     : chr "<a href=\"http://www.tweetdeck.com\" rel=\"nofollow\">TweetDeck</a>"
 $ entities                   :List of 3
  ..$ urls         :List of 1
  .. ..$ :List of 4
  .. .. ..$ indices     : num [1:2] 116 136
  .. .. ..$ display_url : chr "shar.es/p4fyt"
  .. .. ..$ url         : chr "http://t.co/T62gHwaE"
  .. .. ..$ expanded_url: chr "http://shar.es/p4fyt"
  ..$ user_mentions:List of 1
  .. ..$ :List of 5
  .. .. ..$ id_str     : chr "15932085"
  .. .. ..$ screen_name: chr "TeriChristoph"
  .. .. ..$ name       : chr "Teri Christoph"
  .. .. ..$ id         : num 15932085
  ..$ hashtags     : list()
  .. ..- attr(*, "class")= chr "AsIs"
 $ favorited                  : logi FALSE
 $ contributors               : NULL
 $ place                      : NULL
 $ created_at                 : chr "Wed Mar 21 23:25:15 +0000 2012
 $ geo                        : NULL
 $ user                       :List of 38
  ..$ is_translator                     : logi FALSE
  ..$ show_all_inline_media             : logi FALSE
  ..$ profile_link_color                : chr "9D582E"
  ..$ id_str                            : chr "16504112"
  ..$ name                              : chr "Sheryl"
 $ id                         : num 1.83e+17
 $ truncated                  : logi FALSE

0 个答案:

没有答案