R代码突然停止工作在整洁的文本中

时间:2017-04-07 02:32:02

标签: r csv text-mining tidytext

我正在尝试对R中的某些数据进行单词分析。我使用read.csv将一列数据从调查中导入到R中。我将其中一个列命名为#34; text" 。这段代码几天前工作正常,现在它突然给我一个错误。这是我输入的代码:

library(dplyr)

library(tidytext)

A1<-read.csv("/Users/Laura/Documents/A1.csv")

colnames(A1)= c("text")

A1<-A1%>%unnest_tokens(word, text)

我现在得到的错误是这样的:

  

check_input(x)出错:输入必须是任何字符向量   长度或字符向量列表,每个字符向量的长度为   1。

我的数据没有变化,我使用的代码没有改变。 :(我真的不明白为什么会发生这种情况并且对R来说还是新手......是否还有其他需要加载的软件包,可能之前我已经加载过并且没有意识到它?

以下是我的数据的链接: https://www.dropbox.com/s/amg12jp9qx98slz/A1.csv?dl=0

感谢您的帮助

1 个答案:

答案 0 :(得分:0)

我刚刚使用了您在Dropbox上提供的数据,以下代码似乎正在为我运行而没有任何问题。也许尝试不是以CSV格式阅读它?

library(dplyr)
library(tidytext)
library(readr)

A1 <- data_frame(text = read_lines("~/Downloads/A1.csv")) %>%
    mutate(line = row_number())

tidyA1 <- A1 %>%
    unnest_tokens(word, text)

tidyA1
#> # A tibble: 332 × 2
#>     line  word
#>    <int> <chr>
#> 1      1 empty
#> 2      1  your
#> 3      1   cup
#> 4      1  step
#> 5      1    on
#> 6      1   the
#> 7      1  line
#> 8      2  safe
#> 9      2 space
#> 10     3 empty
#> # ... with 322 more rows