假设我们有需要网络抓取的项目。 (解析字符串(< 40)和抓取网页(创建元数据等) 我知道perl有很好的适合这个工作的cpan模块,所以我可以采取这种方式,不要那么烦。但我对速度和内存相关的东西一无所知。
那么,您会选择哪个? (可能是Python ??)就速度而言,哪一个更适合这份工作?请解释一下......
提前致谢。
答案 0 :(得分:4)
使用Perl或Python。两者都有大量用于网络抓取的库。
在Python中,您可以使用BeautifulSoup
来解析即将使用的那些糟糕的HTML页面。
答案 1 :(得分:3)
我曾在这样的环境中成功地使用Perl和WWW-Mechanize。希望您不需要评估.js
。
答案 2 :(得分:1)
我会和perl一起去...我头发的谣言是Google最初使用的语言...... Python也是一种很好的表现语言。