R:序列化对象推送到文本文件然后再生成hive和back

时间:2012-12-05 16:40:06

标签: database r serialization hive

参考以下关于堆栈溢出已经问过的问题

我正在努力实现以下目标: 假设有2个国家的数据

d1 <- data.frame(x=rnorm(100),y=rnorm(100))
d2 <- data.frame(x=rnorm(100),y=rnorm(100))
m1 <- lm(x~y,data=d1);m2 <- lm(x~y,data=d2)
m1.ser <- rawToChar(serialize(m1,NULL,ascii=TRUE))
m2.ser <- rawToChar(serialize(m2,NULL,ascii=TRUE))
res <- data.frame(country=c('c1','c2'),model=c(m1.ser,m2.ser))

在此之后,我想使用write.table以文本形式写出文件,然后将文件推送到配置单元。因此,当由于\ n行对齐而写出文件时会受到干扰,因此将其推入蜂巢会成为问题。

我也知道我可以使用digest包来序列化

m1.ser1 <- digest(m1,ascii=TRUE)
m2.ser1 <- digest(m2,ascii=TRUE)

但我不知道如何从原来的模型m1,m2返回。可能是我错过了一些非常简单的事情。

任何帮助,指针将非常感谢。

另一方面,这个序列化是跨平台的吗?我知道PMML正是为此目的而构建的。但是,像python,java这样的其他语言是否有可能至少弄清出R序列化中的系数和模型属性?

谢谢,

0 个答案:

没有答案