如何使用PyQuery获取表内多个标签的文本内容?

时间:2013-01-20 09:34:55

标签: python pyquery

如何从给定的书籍详细信息表字段中选择属性的文本字段,其中值在文本或文本字段中?

    <table cellspacing="0" class="fk-specs-type2">
        <tr>
            <th class="group-head" colspan="2">Book Details</th>
        </tr>
                                                                                    <tr>
                <td class="specs-key">Publisher</td>
                <td class="specs-value fk-data">HARPER COLLINS INDIA</td>
            </tr>
                                                                                    <tr>
                <td class="specs-key">ISBN-13</td>
                <td class="specs-value fk-data">9789350291924</td>
            </tr>

                </table>

1 个答案:

答案 0 :(得分:3)

您可以使用以下代码段来获取PublisherISBN-13数据:

from pyquery import PyQuery

html = """<table cellspacing="0" class="fk-specs-type2">
        <tr>
            <th class="group-head" colspan="2">Book Details</th>
        </tr>
                                                                                    <tr>
                <td class="specs-key">Publisher</td>
                <td class="specs-value fk-data">HARPER COLLINS INDIA</td>
            </tr>
                                                                                    <tr>
                <td class="specs-key">ISBN-13</td>
                <td class="specs-value fk-data">9789350291924</td>
            </tr>

                </table>
"""

doc = PyQuery(html)

for td in doc("table.fk-specs-type2").find("td.specs-key"):
    print td.text, td.getnext().text

应该打印以下两行

Publisher HARPER COLLINS INDIA
ISBN-13 9789350291924