Question

import urllib.request
from bs4 import BeautifulSoup
url = ('http://texaset.tamu.edu/')
page = urllib.request.urlopen(url).read()
soup = BeautifulSoup(page)
#table = soup.find_all('table')
gdata = soup.find_all('td',{"class":"Data"})
for item in gdata:
  print(item.text)

这是从网站提取数据的代码执行代码输出后类似于：康罗 0.12 58 45 28 15.76 0.00 4.70 6.06

Huntsville的 0.10 56 41 27 16.21 0.00 2.10 3.57

奥弗顿 0.12 53 35 42 16.34 0.00 7.52 16.89

但我只需要一个城市的数据......就像这样：

Conroe的 0.12 58 45 28 15.76 0.00 4.70 6.06

Answer 1

我不确定你在这里问的是什么，但我的猜测是，你试图从表格单元格中提取text。

您是否尝试过print(gdata.text)

编辑1

如果CSS选择器对于所有单元格是相同的，并且认为可能有超过2行提取数据，并且所需数据可以在表格的任何位置;我建议将它们全部提取到列表中，然后搜索Conroe As;

for item in List1:
    if item.startswith('Conroe'):
        print(item)

Python初学者：如何从网站表中的选定行中提取数据

1 个答案: