headers = table.by_tag('th')
labels = [str(t.content).split('(')[0].strip() for t in headers[3:-1]]
我知道split()
和strip()
的含义。但是split('(')[0]
意味着什么? headers
是表格中的内容。
答案 0 :(得分:0)
例如。 HTML是......
<table>
<tr><th>Jerry Brown (D)</th><th>Meg Whitman(D)</th></tr>
<tr><td>1</td><td>4</td></tr>
<tr><td>2</td><td>1</td></tr>
<tr><td>3</td><td>2</td></tr>
</table>
标题可以由BeautifulSoup提取
,结果是一个包含在下面的列表
["<th>Jerry Brown (D)</th>", "<th>Meg Whitman(D)</th>"]
所以t.content
是Jerry Brown (D)
和Meg Whitman(D)
"Jerry Brown (D)".split('(') = ["Jerry Brown ", "D)"]
"Meg Whitman(D)".split('(') = ["Meg Whitman", "D)"]
["Jerry Brown ", "D)"][0] = "Jerry Brown "
["Meg Whitman", "D)"][0] = "Meg Whitman"
和strip()可以删除字符串两边的空格,所以......
标签表示["Jerry Brown","Meg Whitman"]