我应该使用php或python来制作网络爬虫?

时间:2014-09-07 20:30:31

标签: php python python-3.x web-scraping web-crawler

我学习网络爬行,而且我不知道是使用php还是python。我想建立一个网站,从其他网站获取信息并自动更新。 是否有可能用python制作一个像样的网站?或者我必须将信息从python粘贴到html或php?

1 个答案:

答案 0 :(得分:2)

这有点细微差别。 PHP是一种主要用于开发网站(展示它们)的语言,而Python则用于编程网站和编程其他应用程序。因此,它取决于应用程序如何抓取,或者它将被包含在(表示)网站中多少。

Python非常适合抓取任务,因为它有很多第三方库(Scrapy,BeautifulSoup,lxml,request,...),并且还内置了用于请求URL的库。使用PHP,您将有更难的生活请求其他网站。如上所述,它主要集中在建立自己的网站。

此外,它当然取决于每种语言的技能水平。

无论如何,我将应用程序拆分为两部分:

  • 演示逻辑(您自己的网站)
  • 抓取逻辑(抓取其他网站)

两者都将通过数据库连接。抓取逻辑收集信息并将其存储到数据库中。表示逻辑从数据库中获取信息,并以HTML格式显示给用户。

对于抓取部分,您希望更喜欢Python而不是PHP。对于演示部分,它实际上并不重要,而是偏好或知识的问题。