如何使用python获取链接内的元素文本

时间:2019-07-19 06:45:59

标签: javascript python html css

我需要一个简单的脚本,可以在其中输入网址,并且可以获取页面中某个html元素的文本。 例如: 在https://www.transfermarkt.co.uk/schnellsuche/ergebnis/schnellsuche?query=Daley+Blind&x=0&y=0内部 在这种情况下,我需要具有CB的“位置”,并使其控制台登录到我的页面中。

谢谢

1 个答案:

答案 0 :(得分:0)

您可以简单地将此URL作为字符串,然后使用split方法对字符串进行相应的拆分。

如果网址始终相似,即格式始终相同,那么您可以执行以下操作。

df.text_lemmatized.map(pd.unique)

Out[51]:
0         [clear, pending, order]
1    [pending, activation, clear]
Name: text_lemmatized, dtype: object

如果您希望HTML元素形成页面。您可以执行以下操作:

s="https://www.transfermarkt.co.uk/schnellsuche/ergebnis/schnellsuche?query=Daley+Blind&x=0&y=0"

s=s.strip("&")
x=s[-2]
y=s[-1]

x=x.split("=")
y=y.split("=")

xCord=x[-1]
yCord=y[-1]