哪种编程语言单页网页抓取?

时间:2012-08-18 12:44:25

标签: screen-scraping

我想建立(雇用某人建立)Windows程序。此程序必须在本地数据库中的命令(在右键单击或键盘快捷方式下)保存单个网页的一些数据,如网站名称,产品名称和产品价格。我最喜欢哪种编程语言? (负担得起的)程序员的数量以及将来添加一些额外功能的可能性也很重要。 我发现例如python,Java,Ruby和XPath用于这项工作。 谢谢。

1 个答案:

答案 0 :(得分:0)

Java,python和ruby都是不错的选择。 Xpath不是一种编程语言,它是一种查询规范,允许您从xml或html中提取所需的数据。无论您选择哪种语言,您都需要使用xpath(所有3个都有xpath库可用)。

  • Python似乎是最受欢迎的,但它是图书馆的未来 也是最不确定的(没有人为港口机械化而烦恼 python3然而,美丽的汤已经死了然后回来了。)
  • Java的最大优势可能是它已经安装在大多数人身上 Windows机器,但它也是三者中唯一没有的机器 脚本语言,因此可能是开发时间 更长的时间。
  • Ruby是一个很好的选择,有很好的抓取库和很多 程序员使用它。