使用正则表达式捕获字符串中特定的内容

时间:2015-04-16 20:16:22

标签: ruby regex

我不太清楚我应该做什么。我正在利用正则表达式在网站上的HTML中捕获JSON。我已经初始化了一个for循环来遍历数组中的每一行,以找到 {“page_cur”:

我尝试使用以下代码将其推送到数组。  
line.push(json_text)
结果是整个网站的源代码。我做错了什么?

require 'mechanize'
require 'json'

mechanize = Mechanize.new

url = mechanize.get('http://www.hypem.com/')
page = Array.new
page = url.body.split(/\n/) 
json_text = Array.new

#look through every line of code
for line in page 

    #find {"page_cur": 
    next unless line =~ /^\s*\{"page_cur":/  
        #delete </script> tag on the last line
        line.sub! /<.script>/, '' 
        #push into array?

end

1 个答案:

答案 0 :(得分:0)

如果你想进入json_text数组,它应该是json_text.push(line)