我正在尝试为现有的在线网站构建产品数据库,并且需要获取产品说明。
我能够手动进入页面源并复制描述,但我想知道是否有办法解析页面源/将其管道化为文本文件,然后从中获取我需要的内容。
我有每个产品的商品编号,我可以构建链接到产品页面的URL以及所有信息。
我尝试使用curl并将输出传递给文本文件,但是文本文件本身没有显示任何内容。也许我做错了什么?
我希望抓住的例子:
(textarea name =“txtDescription”rows =“10”cols =“20”readonly =“readonly” ID = “txtDescription” 风格=“颜色:灰色;字体家庭:宋体,日内瓦,无衬线;字体大小:小;高度:135px;宽度:400像素;”) 产品说明在这里(/ textarea)