Python初学者:如何从网站表中的选定行中提取数据

时间:2016-02-04 18:49:54

标签: python web-scraping beautifulsoup row

import urllib.request
from bs4 import BeautifulSoup
url = ('http://texaset.tamu.edu/')
page = urllib.request.urlopen(url).read()
soup = BeautifulSoup(page)
#table = soup.find_all('table')
gdata = soup.find_all('td',{"class":"Data"})
for item in gdata:
  print(item.text)

这是从网站提取数据的代码 执行代码输出后类似于: 康罗 0.12 58 45 28 15.76 0.00 4.70 6.06

Huntsville的 0.10 56 41 27 16.21 0.00 2.10 3.57

奥弗顿 0.12 53 35 42 16.34 0.00 7.52 16.89

但我只需要一个城市的数据......就像这样:

Conroe的 0.12 58 45 28 15.76 0.00 4.70 6.06

1 个答案:

答案 0 :(得分:0)

我不确定你在这里问的是什么,但我的猜测是,你试图从表格单元格中提取text

您是否尝试过print(gdata.text)

编辑1

如果CSS选择器对于所有单元格是相同的,并且认为可能有超过2行提取数据,并且所需数据可以在表格的任何位置;我建议将它们全部提取到列表中,然后搜索Conroe As;

for item in List1:
    if item.startswith('Conroe'):
        print(item)