我想将第二行转换为列并对每个列进行评级。 2维基质

时间:2017-11-22 22:58:34

标签: apache-pig

>>> type(range)
<class 'type'>

输出就像:

"User-ID";"ISBN";"Book-Rating"
"276725";"034545104X";"0"
"276726";"0155061224";"5"
"276727";"0446520802";"0"

1 个答案:

答案 0 :(得分:0)

用R中的以下脚本解决它。

加载阅读器库

库(readr)

使用&#39;;&#39;读取CSV文件作为分隔符

BX_Book_Ratings&lt; - read_delim(&#34; C:/ Users / panch / Desktop / Lambton / Term_2_Fall_2017 / 2017F-T2 BDM 2013 - 数据收集方法/ project_03 / dataset / BX-Book-Ratings.csv&#34; ,&#34;;&#34;,escape_double = FALSE,trim_ws = TRUE)

查看数据

查看(BX_Book_Ratings)

加载reshape2库

库(reshape2)

仅从数据集

中读取少量第一行

SAMPLE_DATA&LT; -head(BX_Book_Ratings,30)

生成矩阵

d&lt; - dcast(sample_data,User_ID~ISBN,value.var =&#34; Book_Rating&#34;)

用0

替换NA

d [is.na(d)]&lt; - 0

加载网格库以表格格式显示数据

库(gridExtra)

显示表

grid.table(d)

以CSV格式存储输出

write.csv(d,&#34; C:/ Users / panch / Desktop / Lambton / Term_2_Fall_2017 / 2017F-T2 BDM 2013 - 数据收集方法/ project_03 / dataset / output.csv&#34;)