如何在页面源中抓取文本?

时间:2013-09-17 07:41:46

标签: html css

我正在尝试为现有的在线网站构建产品数据库,并且需要获取产品说明。

我能够手动进入页面源并复制​​描述,但我想知道是否有办法解析页面源/将其管道化为文本文件,然后从中获取我需要的内容。

我有每个产品的商品编号,我可以构建链接到产品页面的URL以及所有信息。

我尝试使用curl并将输出传递给文本文件,但是文本文件本身没有显示任何内容。也许我做错了什么?

我希望抓住的例子:

  

(textarea name =“txtDescription”rows =“10”cols =“20”readonly =“readonly”   ID = “txtDescription”   风格=“颜色:灰色;字体家庭:宋体,日内瓦,无衬线;字体大小:小;高度:135px;宽度:400像素;”)   产品说明在这里(/ textarea)

0 个答案:

没有答案