如何使用Mechanize从表的最后一列中提取URL,其中行包含某些单词

时间:2012-12-05 13:14:04

标签: python mechanize mechanize-python

我正在尝试为我维护的内部票务系统自动执行一些繁琐的Web任务。 有一个页面,自动生成的表格充满了邮件服务器配置。每行用于不同的邮件服务器,每行的最后一列包含2个链接,如果该行中的第一列与特定单词匹配,则我需要提取第一个链接。我正在尝试使用mechanize在python中执行此操作。

这个表就像这样调用:

<table id="pop-mail-servers-table" class="aui aui-table-rowhover">

并且有问题的行如下所示:

            <tr>
                    <td>
                        <span class="mail-server-name">
                            <strong>testhandler-mcfake</strong>
                        </span>
                                                        <div class="description"></div>
                                                </td>
                    <td>
                        <ul class="item-details">
                            <li>
                                <dl>
                                    <dt>Host:</dt>
                                    <dd><span class="mail-server-host">fake.mail.server</span></dd>
                                </dl>
                                <dl>
                                    <dt>Username:</dt>
                                    <dd><span class="mail-server-username">testhandler-mcfake</span></dd>
                                </dl>
                            </li>
                        </ul>
                    </td>
                    <td>
                        <ul class="operations-list">
                            <li><a id="edit-pop-10550" href="UpdatePopMailServer!default.jspa?id=10550">Edit</a></li>
                            <li><a id="delete-pop-10550" href="DeleteMailServer!default.jspa?id=10550">Delete</a></li>
                        </ul>
                    </td>
                </tr>

所以基本上如果第一列包含“testhandler-mcfake”,那么我想从同一行的最后一列中提取该编辑URL。

这是一件事吗?可以吗?

1 个答案:

答案 0 :(得分:1)

PyQuery允许您使用类似jQuery的语法选择HTML元素。