Question

我正在使用tidyverse和rvest。

我用单列创建了一个tibble;一系列包含HTML markdown的字符串。我试图通过每一个并过滤掉字符串中的降价。这似乎是Transmute和rvest的正确用法read_html / html_text：

transmute(responses, response_stripped = html_text(read_html(response_content)))

它确实可以过滤第一行。但是，然后它会获取该结果并为后续的每一行重复它，而不是单独处理它们。

   response_stripped                                                                   
   <chr>                                                                               
 1 The only real branch points that lead me to the right diagnosis occurred after disc…
 2 The only real branch points that lead me to the right diagnosis occurred after disc…
 3 The only real branch points that lead me to the right diagnosis occurred after disc…

知道为什么会这样吗？

Answer 1

在转化之前尝试使用dplyr::rowwise()。

嬗变不适用于每一行

1 个答案: