Python Web Scraping - 尝试从表标签中获取数字

时间:2016-02-22 07:09:04

标签: python html web beautifulsoup screen-scraping

难以从网页中提取我需要的一些数据。

这是我尝试

的事情
from bs4 import BeautifulSoup
import urllib



url = 'http://www.myfxbook.com/community/outlook'

htmlfile = urllib.urlopen(url)

soup = BeautifulSoup(htmlfile)

for tag in soup.findAll('td'):
    print tag

(这会产生数千行代码作为输出)

This is the website

This is where the data that I need is held

我不知道如何使其足够具体

我需要' 5169 Lots'里面的''标签,以及' 2879 Lots'进一步下去。

所以我基本上就是这两个数字显示欧元兑美元的多头和空头数量。

非常感谢任何帮助。

我正在使用Python 2.7

1 个答案:

答案 0 :(得分:4)

children

输出:

next