我正在尝试从在线数据集表(搜索结果)中获取大学名称列表,而大学名称是否在标签和之间,我不确定如何从结果中删除那些。
geo_table = soup.find('table',{'id':'ctl00_cphCollegeNavBody_ucResultsMain_tblResults'})
Colleges=geo_table.findAll('strong')
Colleges
我认为问题是我提取了错误的部分,因为是指粗体。我在哪里可以找到大学的名字?
这是示例输出:
href="?s=IL+MA+PA&p=14.0802+14.0801+14.3901&l=91+92+93+94&id=211440"
答案 0 :(得分:0)
要获取$_.'data-action-name'
值,您需要find_all > $obj = [pscustomobject]@{'data-with-dash' = "data"; 'data@with@at' = "data2"}
> $obj
data-with-dash data@with@at
-------------- ------------
data data2
> $obj.'data-with-dash'
data
> $obj."data@with@at"
data2
标记,然后循环循环并获取属性值href
以获取学院名称,您可以找到<a>
标记并获取文本值。
href