R:在网页中的字符之间提取元素

时间:2014-08-14 21:04:55

标签: html regex r web-scraping

我从网页上有两行信息要解析为data.frame。

  

[104] " $1775 / 2br - 1112ft² - Wonderful two bedroom two bathroom with balcony! (14001 NE 183rd Street )"

     

[269] " var pID = \"4619136687\";"

我希望它看起来像这样。

  

postID |rent|type|size|description |location

     

4619136687|1775|2br |1112|Wonderful two bedroom...|14001 NE 183rd Street

我能够使用sub()命令来获取ID,但我并不完全熟悉sub()命令中的正则表达式,以便在有空格时解析我需要的内容,例如如行[104]

  

sub(".*pID = \"(.*)\";.*","\\1", " var pID = \"4619136687\";")

任何帮助都会很精彩,谢谢!

0 个答案:

没有答案