我目前正在尝试使用python的urllib.request和bs4进行webscrape网站。但是,这个特定的网站有一个截断/虚拟网址,所以我不能放入网址并使用html。
import urllib.request
import bs4 as bs
mylink = urllib.request.urlopen("http://www.vacationstogo.com/ticker.cfm").read()
soup = bs.BeautifulSoup(mylink, "html.parser")
注:
http://www.vacationstogo.com/custom.cfm是我填写一些输入的网站,然后当我点击搜索按钮时,我会收到网址http://www.vacationstogo.com/ticker.cfm。但请注意,之前的网址会将我重定向到某个空的搜索页面,而不是包含我搜索结果的网站的网址。
感谢。