Question

我正在尝试将数据帧转换为R中的字符数组。

这项工作，但文字文件只包含83个记录

{ 
    "_id" : ObjectId("582c2011fe5dc80c8f2f8077"), 
    "menuNumber" : NumberInt(14603), 
    "imageurl" : "menu/test.png", 
    "imageurl_thumb" : "master/14603_thumb.png"
}
{ 
    "_id" : ObjectId("582c2018fe5dc80c8f2f8078"), 
    "menuNumber" : NumberInt(14614), 
    "imageurl" : "menu/test1.png", 
    "imageurl_thumb" : "master/14614_thumb.png"
}

这不起作用..因为它有3k记录吗？

data <- readLines("https://www.r-bloggers.com/wp-content/uploads/2016/01/vent.txt")
df <- data.frame(data)
textdata <- df[df$data, ]

我所知道的是我有一个名为trump posts的数据框。该框架有一个名为Facebook.Status的列。我只是想把它变成一个字符数组，所以我可以对它进行分析。

非常感谢任何帮助。

由于

Answer 1

如果Facebook.Status是一个字符向量，您可以直接对其进行分析。

或者您可以尝试：

trump_text <- as.character(trump_posts$Facebook.Status)

Answer 2

我认为你在某种程度上混淆了data.frame语法和data.table语法。对于DF，您可以将向量引用为df$col。但是，对于DT，它与您编写的dt[,col]或dt[,dt$col]有些相似。此外，如果您想立即使用角色向量，请在stringsAsFactors = F中设置read.csv。否则，您需要额外转换，例如dt[,as.character(col)]或as.character(df$col)。

另外，除非你达到硬件的极限，否则矢量的大小几乎不会成为问题。

将数据帧转换为字符数组？

2 个答案: