解析网页抓取的数据

时间:2016-06-02 14:25:50

标签: ruby-on-rails arrays json web-scraping

所以我从网上搜索了这个

pastebin.com/CMrFcBMX

我想要的是所有价格和门票说明。继承人我有什么

doc.xpath("//script[@type='text/javascript']/text()").each do |text|
       if text.content =~ /more_options_on_polling/
         price1 = text.to_s.scan(/\"(formatted_(?:total_price))\":\"(.+?)\"/).uniq
         description = text.to_s.scan(/\"(ticket_desc)\":\"(.+?)\"/).uniq
         price = price1 + description
         render json: price
       end
     end

所以这就是我现在所拥有的。但是我需要做一些重要的编辑。

首先,我需要说明忽略任何加号,例如Later Owl + Chance For VIP Upgrade\需要被忽略。

其次我需要删除json渲染效果,以便第一个价格和费用与第一个描述匹配。

一旦我有这个渲染我应该排序。我之后会在js文件中使用它,所以这样的格式最好:

  Ticket{
    [
    Price:
    Fees:
    Description:
  ]
  }

一旦我拥有它,我应该很高兴完成我的应用程序^ _ ^

由于 萨姆

0 个答案:

没有答案