如何从结果中删除<>

时间:2019-07-01 14:36:40

标签: python-3.x beautifulsoup

This is the html output from prettify 我正在尝试从在线数据集表(搜索结果)中获取大学名称列表,而大学名称是否在标签之间,我不确定如何从结果中删除那些。

geo_table = soup.find('table',{'id':'ctl00_cphCollegeNavBody_ucResultsMain_tblResults'})

Colleges=geo_table.findAll('strong')
Colleges

我认为问题是我提取了错误的部分,因为是指粗体。我在哪里可以找到大学的名字?

这是示例输出:

href="?s=IL+MA+PA&p=14.0802+14.0801+14.3901&l=91+92+93+94&id=211440"

1 个答案:

答案 0 :(得分:0)

要获取$_.'data-action-name' 值,您需要find_all > $obj = [pscustomobject]@{'data-with-dash' = "data"; 'data@with@at' = "data2"} > $obj data-with-dash data@with@at -------------- ------------ data data2 > $obj.'data-with-dash' data > $obj."data@with@at" data2 标记,然后循环循环并获取属性值href以获取学院名称,您可以找到<a>标记并获取文本值。

href