刮亚马逊产品详细信息:布局输出RShiny

时间:2020-01-22 17:03:12

标签: r web-scraping shiny rvest

“新手”和“一般”抓取工具。

我可以从亚马逊上刮取产品说明的项目要点,但效果很好,但是它们不会停留在项目要点形式,而只是合并为一个段落,但是我希望将闪亮的输出保留为项目要点。< / p>

ui.R

ui <- fluidPage(
    titlePanel("AMZ Scorecard"),


mainPanel(textInput("asin", "Insert ASIN", value = "", width = NULL, placeholder = "B07BFDH45"),


fluidRow(tags$div(tags$ul(tags$li(textOutput("prodbullets"[[1]])))))
         )

Server.R

server <- function(input, output) {
output$prodbullets <- renderText({
HtmlLink <- paste0("https://www.amazon.com/dp/",input$asin)
txtPage <- read_html(HtmlLink)

ProdDesc <- txtPage %>%
    html_node("ul.a-spacing-none")%>%
    html_text()
ProdDesc <- getCleanText(ProdDesc)
ProdDesc <- gsub("\\t+", " ",ProdDesc)
ProdDesc <- strsplit(ProdDesc,"  ",fixed = T)
ProdDesc <- unlist(ProdDesc)

print(ProdDesc)
})
}

如您所见,我认为这可能是一个字符串,因此我可以选择第一个元素并单独输出它们,但没有。 我知道它可能非常简单,所以请帮一个兄弟。

谢谢

0 个答案:

没有答案