“新手”和“一般”抓取工具。
我可以从亚马逊上刮取产品说明的项目要点,但效果很好,但是它们不会停留在项目要点形式,而只是合并为一个段落,但是我希望将闪亮的输出保留为项目要点。< / p>
ui.R
ui <- fluidPage(
titlePanel("AMZ Scorecard"),
mainPanel(textInput("asin", "Insert ASIN", value = "", width = NULL, placeholder = "B07BFDH45"),
fluidRow(tags$div(tags$ul(tags$li(textOutput("prodbullets"[[1]])))))
)
Server.R
server <- function(input, output) {
output$prodbullets <- renderText({
HtmlLink <- paste0("https://www.amazon.com/dp/",input$asin)
txtPage <- read_html(HtmlLink)
ProdDesc <- txtPage %>%
html_node("ul.a-spacing-none")%>%
html_text()
ProdDesc <- getCleanText(ProdDesc)
ProdDesc <- gsub("\\t+", " ",ProdDesc)
ProdDesc <- strsplit(ProdDesc," ",fixed = T)
ProdDesc <- unlist(ProdDesc)
print(ProdDesc)
})
}
如您所见,我认为这可能是一个字符串,因此我可以选择第一个元素并单独输出它们,但没有。 我知道它可能非常简单,所以请帮一个兄弟。
谢谢