为什么jsonlite会将数据解析为列表对象?

时间:2016-03-19 18:13:46

标签: r jsonlite

我尝试使用jsonlite解析来自Web API的数据,但由于某种原因,它返回的对象是一个列表。

jsonlite包文档中说,简化过程会自动将JSON列表转换为更具体的R类,但在我的情况下,它不起作用。

就像simplifyVectorsimplifyDataFramesimplifyMatrix功能被禁用,但每个功能都默认启用。

我想要的是一个检索$Name数据的数据帧(EAC,EFL,ELC等)。

我也尝试使用rjson库,但问题仍然存在。

知道可能出现什么问题吗?

谢谢,

请找到我使用的代码:

raw <- getURL("https://www.cryptocompare.com/api/data/coinlist")
library(jsonlite)
data <- fromJSON(txt=raw)

> class(data)
[1] "list"

> typeof(data)
[1] "list"

> str(data)
[...]
  ..$ EAC   :List of 13
  .. ..$ Id                 : chr "4437"
  .. ..$ Url                : chr "/coins/eac/overview"
  .. ..$ ImageUrl           : chr "/media/19690/eac.png"
  .. ..$ Name               : chr "EAC"
  .. ..$ CoinName           : chr "EarthCoin"
  .. ..$ FullName           : chr "EarthCoin (EAC)"
  .. ..$ Algorithm          : chr "Scrypt"
  .. ..$ ProofType          : chr "PoW"
  .. ..$ FullyPremined      : chr "0"
  .. ..$ TotalCoinSupply    : chr "13500000000"
  .. ..$ PreMinedValue      : chr "N/A"
  .. ..$ TotalCoinsFreeFloat: chr "N/A"
  .. ..$ SortOrder          : chr "100"
  ..$ EFL   :List of 13
  .. ..$ Id                 : chr "4438"
  .. ..$ Url                : chr "/coins/efl/overview"
  .. ..$ ImageUrl           : chr "/media/19692/efl.png"
  .. ..$ Name               : chr "EFL"
  .. ..$ CoinName           : chr "E-Gulden"
  .. ..$ FullName           : chr "E-Gulden (EFL)"
  .. ..$ Algorithm          : chr "Scrypt"
  .. ..$ ProofType          : chr "PoW"
  .. ..$ FullyPremined      : chr "0"
  .. ..$ TotalCoinSupply    : chr "21000000 "
  .. ..$ PreMinedValue      : chr "N/A"
  .. ..$ TotalCoinsFreeFloat: chr "N/A"
  .. ..$ SortOrder          : chr "101"
  ..$ ELC   :List of 13
  .. ..$ Id                 : chr "4439"
  .. ..$ Url                : chr "/coins/elc/overview"
  .. ..$ ImageUrl           : chr "/media/19694/elc.png"
  .. ..$ Name               : chr "ELC"
  .. ..$ CoinName           : chr "Elacoin"
  .. ..$ FullName           : chr "Elacoin (ELC)"
  .. ..$ Algorithm          : chr "Scrypt"
  .. ..$ ProofType          : chr "PoW"
  .. ..$ FullyPremined      : chr "0"
  .. ..$ TotalCoinSupply    : chr "75000000"
  .. ..$ PreMinedValue      : chr "N/A"
  .. ..$ TotalCoinsFreeFloat: chr "N/A"
  .. ..$ SortOrder          : chr "102"
  .. [list output truncated]
 $ Type        : int 100
NULL

2 个答案:

答案 0 :(得分:2)

我回答我自己的问题 - 已经在评论部分说过 - 返回的对象已经是最简单的形式。可能jsonlite无法从多个列表创建数据框(列表重叠)。

我找到的解决方案是使用unlistdata.frame,如下所示:

> df <- data.frame(unlist(data))
> class(df)
[1] "data.frame"

答案 1 :(得分:2)

您展示了结构的下端,但是在结构的顶部可以看到关于数据帧未返回的问题的答案:

 # note: needed `require(RCurl)` to obtain getURL
> str(data)
List of 6
 $ Response    : chr "Success"
 $ Message     : chr "Coin list succesfully returned!"
 $ BaseImageUrl: chr "https://www.cryptocompare.com"
 $ BaseLinkUrl : chr "https://www.cryptocompare.com"
 $ Data        :List of 492
  ..$ BTC   :List of 13
  .. ..$ Id                 : chr "1182"
  .. ..$ Url                : chr "/coins/btc/overview"
  .. ..$ ImageUrl           : chr "/media/19633/btc.png"
  .. ..$ Name               : chr "BTC"
  .. ..$ CoinName           : chr "Bitcoin"
  .. ..$ FullName           : chr "Bitcoin (BTC)"
  .. ..$ Algorithm          : chr "SHA256"
 # ------snipped the many, many pages of output that followed---------

此外,该列表的$ Data节点具有不规则的长度,因此在一个步骤中强制执行数据帧可能很困难:

>  table( sapply(data$Data, length))

 12  13  14 
  2 478  12 

加载pkg:plyr后,它提供了一个有用的功能来处理相似但不完全相同的数据帧,我能够构建一个有用的起点进行分析:

require(plyr)
money <-   do.call(rbind.fill, lapply( data$Data, data.frame, stringsAsFactors=FALSE))
str(money)
#------------    
'data.frame':   492 obs. of  14 variables:

 $ Id                 : chr  "1182" "3808" "3807" "5038" ...
 $ Url                : chr  "/coins/btc/overview" "/coins/ltc/overview" "/coins/dash/overview" "/coins/xmr/overview" ...
 $ ImageUrl           : chr  "/media/19633/btc.png" "/media/19782/ltc.png" "/media/20626/dash.png" "/media/19969/xmr.png" ...
 $ Name               : chr  "BTC" "LTC" "DASH" "XMR" ...
 $ CoinName           : chr  "Bitcoin" "Litecoin" "DigitalCash" "Monero" ...
 $ FullName           : chr  "Bitcoin (BTC)" "Litecoin (LTC)" "DigitalCash (DASH)" "Monero (XMR)" ...
 $ Algorithm          : chr  "SHA256" "Scrypt" "X11" "CryptoNight" ...
 $ ProofType          : chr  "PoW" "PoW" "PoW/PoS" "PoW" ...
 $ FullyPremined      : chr  "0" "0" "0" "0" ...
 $ TotalCoinSupply    : chr  "21000000" "84000000" "22000000" "0" ...
 $ PreMinedValue      : chr  "N/A" "N/A" "N/A" "N/A" ...
 $ TotalCoinsFreeFloat: chr  "N/A" "N/A" "N/A" "N/A" ...
 $ SortOrder          : chr  "1" "3" "4" "5" ...
 $ TotalCoinsMined    : chr  NA NA NA NA ...

如果您希望能够通过这些加密货币的缩写来访问行,您可以这样做:

rownames(money) <- names(data$Data)

现在可以执行此操作:

> money[ "BTC", ]
      Id                 Url             ImageUrl Name CoinName
BTC 1182 /coins/btc/overview /media/19633/btc.png  BTC  Bitcoin
         FullName Algorithm ProofType FullyPremined TotalCoinSupply
BTC Bitcoin (BTC)    SHA256       PoW             0        21000000
    PreMinedValue TotalCoinsFreeFloat SortOrder TotalCoinsMined
BTC           N/A                 N/A         1            <NA>

在访问之前,访问会更加笨重:

> money[ money$Name=="BTC", ]