在表列中查找特定的类(python,lxml)

时间:2018-10-25 08:39:59

标签: python web-scraping lxml

我被扔到python和lxml中(“更改此现有程序”),并试图通过这样做找到自己的方式。 因此,我很抱歉提出一个简单或愚蠢的问题……但是我有点受阻。

该程序通过

将表分解为行
rows=page.cssselect("table-data.table-top tbody tr")

处理各列(之后:对于一行中的行)
dns = row.cssselect(".column-number")
cds = row.cssselect(".column-documents")

但是,在"column-documents"列中有几个(也许是0,也许是5)条目(空,带有链接的1个图标,最多具有链接和不同含义的5个图标,每个图标都有其自己的类定义)。而且我需要找出是否在其中给出了特定的条目(带有链接的图标)。

它被描述为特定的类"class="document-link submission-link hide-text"

<tr class="row-0 tier1-5">
   <td class="column-notext">4.</td>
   <td class="column-label">Descriptive title</td>
   <td class="column-number">007</td>
   <td class="column-dokumente">
      <a href="/somelink.pdf" target="_blank" title="title of pdf">
         <span class="document-link submission-link hide-text">
            <span>Main Document</span>
         </span>
      </a>
      <a href="/somelink.pdf) title 2">
         <span class="attachment-link submission-attachment-link hide-text">
            <span>(text)</span>
         </span>
      </a>
      <a href="/link.pdf" target="_blank" title="some title">
         <span class="document-link beschluss-link hide-text">
            <span>text</span>
         </span>
      </a>
      <span class="document-spacer hide-text" />
      <a href="html-link" title="some title">
         <span class="vorgang-link hide-text">
            <span>text</span>
         </span>
      </a>
   </td>
</tr>

我只需要知道这是否存在。 我愚蠢的问题是:我该怎么做?

预先感谢, 安德烈亚斯。

0 个答案:

没有答案