Python美丽的汤网刮

时间:2015-08-02 00:16:17

标签: python html beautifulsoup

我的脚本粘贴在下面。我目前正在为我感兴趣的每个td标签存储和显示整个td标签,但不知道如何只提取标签之间的数据/文本

from bs4 import BeautifulSoup
from array import *
import urllib

url_MLB = "www.somewebsiteMLB"

var = urllib.urlopen(url_MLB).read()
soup = BeautifulSoup(var, 'html.parser')

cnt=0
labelvar = soup.find_all("label")

for element in labelvar:
    cnt+=1

cnt=cnt/12
cnt=cnt*4

i=0
store_date_tag = []
while(i<cnt):
        i = i + 1
        store_date_tag.append(soup.find_all("td", id="date"+str(i)+"_cell"))

i=0

for element in store_date_tag:
        print store_date_tag[i]
        print "\n"
        i+=1

print "Good bye!"

1 个答案:

答案 0 :(得分:1)

我读了你的问题,我认为你只想要tag.is之间的文字吗?如果是这样看这个

<?php
    $email=$username='';        //  etc
    if(isset($_POST['submit'])) {   //  or whatever you name the submit button
        //  validate data
        if(!$errors) {
            //  process
            //  new location
        }
        //  retain values from above
    }
?>

<form>
    <label>Name: <input type="text" name="username" value="<?php print $username; ?>"></label>
    <label>Email: <input type="text" name="email" value="<?php print $email; ?>"></label>
    <!-- etc -->
    <button type="submit" name="submit">Send Message</button>
</form>

我不确定它是否与您的问题相符。