我不太清楚我应该做什么。我正在利用正则表达式在网站上的HTML中捕获JSON。我已经初始化了一个for循环来遍历数组中的每一行,以找到 {“page_cur”:
我尝试使用以下代码将其推送到数组。
line.push(json_text)
结果是整个网站的源代码。我做错了什么?
require 'mechanize'
require 'json'
mechanize = Mechanize.new
url = mechanize.get('http://www.hypem.com/')
page = Array.new
page = url.body.split(/\n/)
json_text = Array.new
#look through every line of code
for line in page
#find {"page_cur":
next unless line =~ /^\s*\{"page_cur":/
#delete </script> tag on the last line
line.sub! /<.script>/, ''
#push into array?
end
答案 0 :(得分:0)
如果你想进入json_text数组,它应该是json_text.push(line)