将ul标签中的内容解压缩到excel文件中

时间:2014-10-14 04:54:19

标签: html imacros

我有这个网站,我想提取以下内容:

http://www.ipmart.com.my/main/product/BlackBerry_Porsche_Design_P_9982_Silver_BlackBerry_Warranty_454805.php?prod=454805

来自网站的图片,标题,描述和规范以及包装内容。

我厌倦了以下几行,但它提取了错误的信息

TAG POS = 1 TYPE = A ATTR = div:productDetailUl EXTRACT = TXT TAG POS = 1 TYPE = H1 ATTR = TXT:* EXTRACT = TXT

任何人都可以帮我解决这个问题吗? 谢谢。 Nuwan。

1 个答案:

答案 0 :(得分:0)

我会尝试使用XPATH来提取正确的信息。

使用Chrome抓取xpath最简单:

  1. 右键单击要提取的内容
  2. 点击"检查元素"
  3. 右键单击检查中突出显示的代码行 工具(你可能需要调整它,但你基本上想要抓住 最接近您尝试提取的信息的元素。 它通常很不错,但可能需要一些工作。)
  4. 点击"复制Xpath"
  5. 在iMacros脚本中,使用: TAG XPATH ="在这些引号之间粘贴你的xpath" EXTRACT = TXT

    我会为此使用iMacros for Firefox,因为它似乎有点错误。