我正在使用beautifulsoup
来抓取网站上的数据。
当我从PyCharm运行它时,我的代码有效。
当我在我的网站上运行它(如newser.000webhost.com/new.py
)时,它无法运行。
如何在我的网站上运行我的代码?
import requests
from bs4 import BeautifulSoup
def trade_spider(max_pages):
page = 1
while page <= max_pages:
url = 'https://www.geo.tv/category/sports/'+ str(page)
source_code = requests.get(url, allow_redirects=False)
plain_text = source_code.text.encode('ascii', 'replace')
soup = BeautifulSoup(plain_text, 'html.parser')
for div in soup.findAll('div', {'class': 'geo-zoom-effect'}):
for a in div.findAll('a'):
title = a.get('title')
href = a.get('href')
print title
print href
for img in a.findAll('img'):
src=img.get('src')
print src
page+=1
trade_spider(5)
答案 0 :(得分:1)
000webhost是一个Webhost,提供HTML,CSS,PHP和MySQL文件,不是Python主机。
如果您正在寻找完整的UNIX环境并托管您的Python文件,Digital Ocean是一个相当便宜(每月5美元)且可靠的VPS。
如果不熟悉或想要免费,我会推荐PythonAnywhere或OpenShift