使用RJSONIO :: fromJSON()简化POSIX节点

时间:2014-12-05 01:22:27

标签: json r rjsonio

我有以下双值向量x,其中每个元素代表一个POSIX日期时间

x <- c(1417621083, 1417621204, 1417621384, 1417621564, 1417621623)

我正在使用 RJSONIO 包,并希望继续这样做。

作为练习,我想将这些值转换为JSON文本,然后再将它们读回R,但是我很难将日期时间表示转换为一个很好的简化列表结果。在JSON中,日期需要采用特殊格式,因此x中的值将转换为以下内容:

dates <- c("/new Date(1417621083)", "/Date(1417621204)", "/Date(1417621384)", 
           "/Date(1417621564)", "/Date(1417621623)")

当我通过 RJSONIO 解析器运行带有第二个任意向量的dates时,一切似乎都很顺利。

library(RJSONIO)
make <- toJSON(list(date = dates, value = LETTERS))

然后当我使用stringFun选项和日期的R-json C例程解析新的JSON文本时,结果是一个双元素列表,第一个元素是列表,第二个元素是原子向量。

(read <- fromJSON(make, stringFun = "R_json_dateStringOp"))
# $date
# $date[[1]]
# [1] "2014-12-03 07:38:03 PST"
# 
# $date[[2]]
# [1] "2014-12-03 07:40:04 PST"
# 
# $date[[3]]
# [1] "2014-12-03 07:43:04 PST"
# 
# $date[[4]]
# [1] "2014-12-03 07:46:04 PST"
# 
# $date[[5]]
# [1] "2014-12-03 07:47:03 PST"
# 
# 
# $value
# [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M"
# [14] "N" "O" "P" "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z"

但我期待着两个载体的列表,我宁愿以

的形式出现
# $date
# [1] "2014-12-03 07:38:03 PST" "2014-12-03 07:40:04 PST"
# [3] "2014-12-03 07:43:04 PST" "2014-12-03 07:46:04 PST"
# [5] "2014-12-03 07:47:03 PST"
# 
# $value
# [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M" "N" "O" "P" "Q"
# [18] "R" "S" "T" "U" "V" "W" "X" "Y" "Z"

我尝试了几种方法来简化fromJSON()调用中的结果,但没有一种方法有效。以下是我的一些尝试:

使用处理程序:这简化了结果,但无法重新格式化日期

h1 <- basicJSONHandler(simplify = TRUE)
fromJSON(make, handler = h1, stringFun = "R_json_dateStringOp")
# $date
# [1] "/new Date(1417621083)" "/Date(1417621204)"    
# [3] "/Date(1417621384)"     "/Date(1417621564)"    
# [5] "/Date(1417621623)"    
# 
# $value
# [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M"
# [14] "N" "O" "P" "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z"

尝试 simplify 参数:我尝试了几种不同的变种,但都没有效果。

fromJSON(make, simplify = StrictCharacter)
# $date
# [1] "/new Date(1417621083)" "/Date(1417621204)"    
# [3] "/Date(1417621384)"     "/Date(1417621564)"    
# [5] "/Date(1417621623)"    
#
# $value
#  [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M"
# [14] "N" "O" "P" "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z"

有没有办法简化调用fromJSON()的日期结果?

3 个答案:

答案 0 :(得分:5)

我认为你无法在同一时间内将日期和它们的简化强制转换为向量。原因很简单,这不是({1}}中实现的。实际上,正如您所提到的,简化是使用标志RJSONIOStrictLogicalStrictNumeric来完成的,这些标志创建逻辑,数字或字符向量。也许您应该联系维护者,为StrictCharacter日期添加StrictPosixct标志。

使用POSIXct无能为力,因为它接收标量元素(字符串)并且不知道其他向量元素。您可以通过将R函数定义为stringFun参数并在其中放入浏览器来检查这一点。

stringFun

我猜你想在解析你的json时出于性能原因进行强制/简化。我会使用不同的策略:

  1. 我将我的数值强制转换为POSIXct,并将它们存储为格式良好的日期中的字符。这比特殊(丑陋)“新日期(..,日期”)RJSONIO日期格式更好。请记住,json格式是一种标准格式,可以被其他语言解析(python,js,..)
  2. 然后将我的日期解析为普通字符,并使用快速convertJSONDate <- function(x) { if(grepl('Date',x)){ val <- sub('.*[(]([0-9]+).*','\\1',x) return(structure(as.numeric(val)/1000, class = c("POSIXct", "POSIXt"))) } x } 包将其强制转换为POSIXct向量。
  3. 这里有一些代码可以显示:

    fasttime

答案 1 :(得分:3)

从我猜测的read值是理想的起点......这是一种方式:

> dd <- sapply(read, c) 
> class(dd) <- "POSIXct"
> dd
[1] "2014-12-03 07:38:03 PST" "2014-12-03 07:40:04 PST" "2014-12-03 07:43:04 PST"
[4] "2014-12-03 07:46:04 PST" "2014-12-03 07:47:03 PST"

阶级强制是一种“肮脏的”#34;但我已经尝试过其他一些(失败的)策略,例如unlistsapply( read,"[[",1)sapply(read, c)),为了保留属性,所以我决定用R来解决问题并摆动锤子。

答案 2 :(得分:0)

由于赏金已过期,而且事实证明目前无法在RJSONIO(或者看起来如此)中进行此操作,我将把它作为另一种替代方法,以防任何其他用户遇到这个问题,需要一个解决方案。

jsonlite可以轻松完成此操作。我们所要做的就是将POSIXt类添加到数字向量中,并为非导出函数"mongo"中的解析器指定asJSON

# unloadNamespace(RJSONIO)  ## to avoid confusion between packages
library(jsonlite)    

x <- c(1417621083, 1417621204, 1417621384, 1417621564, 1417621623)

class(x) <- "POSIXt"    

data <- list(dates = x, values = letters[1:5])

json <- jsonlite:::asJSON(data, POSIXt = "mongo")

fromJSON(json)
# $dates
# [1] "2014-12-03 07:38:03 PST" "2014-12-03 07:40:04 PST"
# [3] "2014-12-03 07:43:04 PST" "2014-12-03 07:46:04 PST"
# [5] "2014-12-03 07:47:03 PST"
# 
# $values
# [1] "a" "b" "c" "d" "e"