我正在使用tidyverse和rvest。
我用单列创建了一个tibble;一系列包含HTML markdown的字符串。我试图通过每一个并过滤掉字符串中的降价。这似乎是Transmute和rvest的正确用法read_html / html_text:
transmute(responses, response_stripped = html_text(read_html(response_content)))
它确实可以过滤第一行。但是,然后它会获取该结果并为后续的每一行重复它,而不是单独处理它们。
response_stripped
<chr>
1 The only real branch points that lead me to the right diagnosis occurred after disc…
2 The only real branch points that lead me to the right diagnosis occurred after disc…
3 The only real branch points that lead me to the right diagnosis occurred after disc…
知道为什么会这样吗?
答案 0 :(得分:1)
在转化之前尝试使用dplyr::rowwise()
。