Perl vs PHP to web scraping

时间:2011-04-04 12:24:00

标签: php python perl performance web-scraping

假设我们有需要网络抓取的项目。 (解析字符串(< 40)和抓取网页(创建元数据等) 我知道perl有很好的适合这个工作的cpan模块,所以我可以采取这种方式,不要那么烦。但我对速度和内存相关的东西一无所知。

那么,您会选择哪个? (可能是Python ??)就速度而言,哪一个更适合这份工作?请解释一下......

提前致谢。

3 个答案:

答案 0 :(得分:4)

使用Perl或Python。两者都有大量用于网络抓取的库。

在Python中,您可以使用BeautifulSoup来解析即将使用的那些糟糕的HTML页面。

答案 1 :(得分:3)

我曾在这样的环境中成功地使用Perl和WWW-Mechanize。希望您不需要评估.js

答案 2 :(得分:1)

我会和perl一起去​​...我头发的谣言是Google最初使用的语言...... Python也是一种很好的表现语言。