我正在尝试将数据帧转换为R中的字符数组。
这项工作,但文字文件只包含83个记录
{
"_id" : ObjectId("582c2011fe5dc80c8f2f8077"),
"menuNumber" : NumberInt(14603),
"imageurl" : "menu/test.png",
"imageurl_thumb" : "master/14603_thumb.png"
}
{
"_id" : ObjectId("582c2018fe5dc80c8f2f8078"),
"menuNumber" : NumberInt(14614),
"imageurl" : "menu/test1.png",
"imageurl_thumb" : "master/14614_thumb.png"
}
这不起作用..因为它有3k记录吗?
data <- readLines("https://www.r-bloggers.com/wp-content/uploads/2016/01/vent.txt")
df <- data.frame(data)
textdata <- df[df$data, ]
我所知道的是我有一个名为trump posts的数据框。该框架有一个名为Facebook.Status的列。我只是想把它变成一个字符数组,所以我可以对它进行分析。
非常感谢任何帮助。
由于
答案 0 :(得分:1)
如果Facebook.Status
是一个字符向量,您可以直接对其进行分析。
或者您可以尝试:
trump_text <- as.character(trump_posts$Facebook.Status)
答案 1 :(得分:0)
我认为你在某种程度上混淆了data.frame
语法和data.table
语法。对于DF,您可以将向量引用为df$col
。但是,对于DT,它与您编写的dt[,col]
或dt[,dt$col]
有些相似。此外,如果您想立即使用角色向量,请在stringsAsFactors = F
中设置read.csv
。否则,您需要额外转换,例如dt[,as.character(col)]
或as.character(df$col)
。
另外,除非你达到硬件的极限,否则矢量的大小几乎不会成为问题。