刮表:字幕盲

时间:2017-12-06 15:39:30

标签: python beautifulsoup caption blind

我正在从页面抓一张桌子。

但是表格的标题是“盲目的”。

是否无法从网站中提取表格?

使用BeautifulSoup,如:

from urllib.request import urllib
from bs4 import BeautifulSoup

1 个答案:

答案 0 :(得分:0)

看看这个:

import bs4 as bs
import urllib.request

link = 'http://companyinfo.stock.naver.com/v1/company/c1010001.aspx?cn=&cmp_cd=005930&menuType=block'
source = urllib.request.urlopen(link)

soup = bs.BeautifulSoup(source, 'html.parser')

table = soup.find('table', attrs={'id' : 'cTB24'})

for tr in table.find_all('tr'):
    for td in tr.find_all('td'):
        print(td.text)