使用BeautifulSoup 4时如何从表中获取信息?

时间:2014-11-28 09:22:59

标签: python web-scraping beautifulsoup html-table

我有一张桌子,在下面找到并存储为“桌子”。它包含以下内容:

http://pastebin.com/aBFLpU4U

我的代码捕获了正确的信息,但我需要知道如何将每条信息都放入其自己的变量中。我很感激任何帮助,我只和BeautifulSoup一起玩了一个星期,所以请原谅我。我已经遍布堆栈,但没有找到适合我的答案。

这是我看到的输出:http://pastebin.com/fiYQvBix

import sys, locale, os, re, urllib2
import lxml.etree, requests
from bs4 import BeautifulSoup as bSoup

# Website that we are scraping:
BASE_URL = 'https://www.biddergy.com/detail.asp?id='

#ID = raw_input("Enter listing #: ")
ID = str(330998) # defined constant for debugging
# Store response in soup:
response  = requests.get(BASE_URL+ID)
soup = bSoup(response.text)

# Find auction info <table>
table = soup.find('table', cellpadding="2")

#### Everything above this line works great ####

for row in table.find_all('tr'):
    for col in row.find_all("td"):
        print(col.string)

1 个答案:

答案 0 :(得分:2)

好吧,我已经弄清楚了。

data = []
for row in table.find_all('tr'):
    for cols in row.find_all('td', text=True)
        for col in cols:
            data.append(col.strip())

然后可以从data []列表中提取数据并将其保存到相应的变量中。

感谢所有读过我问题的人!