使用BeautifulSoup从html文件中提取特定文本

时间:2018-09-15 10:12:34

标签: python html beautifulsoup

我有一个类似下面的代码。我正在使用BeautifulSoup刮擦class ='product'中的文本。但是我提取的csv文件中只需要第二和第四值(即“产品2”和“产品4”)。到目前为止,我只知道提取所有值(即“产品1”,“产品2”,“产品3”,“产品4”)。

<body>
    <div class="product">Product 1</div>
    <div class="product">Product 2</div>
    <div class="product">Product 3</div>
    <div class="product">Product 4</div>
</body>

1 个答案:

答案 0 :(得分:2)

find_all返回一个列表,因此请使用索引来获取所需的元素

Private Sub TextBox1_Change()
    Dim iList As Long
    With Me.ComboBox1
        For iList = 0 To .ListCount - 1
            If Left(.List(iList), Len(Me.TextBox1.Value)) = Me.TextBox1.Value Then
                .ListIndex = iList ' if any combobox1 value matches textbox1 value  then select it
                Exit Sub
            End If
        Next
        .ListIndex = -1 ' if no combobox1 value matches textbox1 value then "deselect" combobox1 
    End With
End Sub