在R中没有NA强制的字符\因子转换为数字

时间:2016-05-27 15:15:15

标签: r data-conversion

我是R的新手,希望你可以提供帮助,因为R中的数据模式似乎有很大困难。

我有一个带有评论的csv,在我的专栏中有一个表达评论的数据\时间。不幸的是,格式的形式为os“x years / months / days ago”,因此我不得不将列转换为1 - 将时间转换为总天数,然后减去总天数的2天。我抓取数据的日期。

就是这样。这应该是一个问题,但在某种程度上,在步骤#1,当我将给定时间转换为正则表达式时,例如:

“10个月,3个星期前”变成“10 * 30 + 3 * 7”;

<11>“11个月前”转为“11 * 30”;

“1年,1个月前”变为“1 * 365 + 1 * 30”

  reviews$V6 <- gsub("hour","*0", reviews$V6); as.data.frame(reviews$V6)
  reviews$V6 <- gsub("day","*1", reviews$V6); as.data.frame(reviews$V6)
  reviews$V6 <- gsub("week","*7", reviews$V6); as.data.frame(reviews$V6)
  reviews$V6 <- gsub("month","*30", reviews$V6); as.data.frame(reviews$V6)
  reviews$V6 <- gsub("year","*365", reviews$V6); as.data.frame(reviews$V6)
  reviews$V6 <- gsub(",","+", reviews$V6); as.matrix(reviews$V6)

结果被识别为字符,因此不执行计算。我尝试通过

将其转换为数字
reviews$date <- as.numeric(as.factor(reviews$date))

但它仍然无效。最终数据转换为数字,但不能正确计算airthmetic操作。我假设因为运算符不被识别(?)

抬头时:

mode(reviews$date) = 'character"

我查了几个论坛条目,但它们都引用了没有操作符的数字数据,因此我想这是一个特例。

0 个答案:

没有答案