我不能用Python抓取正确的字符串

时间:2017-02-21 11:57:06

标签: python html web-scraping web-crawler bs4

我想从带有Python脚本的网站获取手机号码。如果您还没有登录,该网站会显示这样的手机号码:

0123 ...

如果我已登录,则显示如下:

123 456

这是我登录时网站上的HTML代码:

<span id="phone" class="text-bold">0123456</span>

我的代码是:

from bs4 import BeautifulSoup
import requests

def crawler_2():
    url = 'www.example.com'         
    source_code = requests.get(url) 
    plain_text = source_code.text
    soup = BeautifulSoup(plain_text)

    for link in soup.find_all('span', {'class': 'text-bold'}):
        number = link.string
        print (number)

crawler_2()

我已使用浏览器登录,但仍无法获得完整的号码。 在控制台中,输出是数字的缩短版本,就像我没有登录一样。

我是在错误的轨道上还是需要Mechanize或其他东西?

0 个答案:

没有答案