使用R

时间:2016-05-21 06:07:53

标签: r

我使用read.csv加载了一个csv文件。这有18列和9000多行。

其中我特意尝试使用两列: 1)日期,有日期。 2)审查文本,每个条目有几行文本,并且是一个列表。

我已经从CSV中单独提取了这两列,并尝试将它们组合在一起以获得看起来像

的对象
Date            review_text
2009-01-01        " This is good"
2010-01-01        "Was a great experience"

等等。 我尝试过使用c,paste和cbind,但我无法将这两个对象组合在一起。 如果您有任何建议,请告诉我。 在一个相关的说明中,一旦我将这些结合起来,我试图按日期对结果对象进行排序,按季度对条目进行分组,那么最好将它放入哪个对象?请指教。 谢谢!

1 个答案:

答案 0 :(得分:0)

这将是我的解决方案,使用lubridate和dplyr包:

library(dplyr)
library(lubridate)

set.seed(123)
reviews <- data.frame(
  date = as.Date("2016-05-21") - runif(100, 0, 365),
  text = paste("Test", 1:100)
)

output <- reviews %>%
  arrange( date ) %>%
  group_by( dyear = year( date ), dQ = quarter( date ) ) %>%
  summarise(
    output = paste( paste( date, text ), collapse = ":::")
  ) %>%
  ungroup() %>%
  arrange( dyear, dQ )

输出有点难以发布,因为字符部分非常长。这让我想到了最重要的问题:你为什么要这样做?

编辑:哦,您对问题的澄清使得这个答案无关紧要。看一下merge函数,但是当你没有给出一个可重复的例子时很难提供任何东西,所以我们知道你的数据结构。
祝你好运!