从同一网站的链接中获取数据

时间:2019-02-03 02:47:11

标签: python vb.net

感谢您抽出时间来阅读本 我想知道是否有什么办法,我可以从不同环节的特定代码,但它们都是同一个域的我的意思是,如果我把很多的Facebook页面上的链接它得到他们的名字在文本文件中,每个人在不同的行

1 个答案:

答案 0 :(得分:1)

我想如果我理解您需要链接中的用户名。

facebook.com/zuck

acebook.com/moskov

您可以跟踪并提取页面标题,这可能并不总是准确的。

>   <title id="pageTitle">Mark Zuckerberg</title>  
>   <title id="pageTitle">Dustin Moskovitz</title>

html2text是一个Python脚本,可将HTML页面转换为清晰易读的纯ASCII文本。更好的是,ASCII也恰好是有效的Markdown(文本到HTML格式)。 https://github.com/Alir3z4/html2text

如果您想阅读网址,请检查以下说明 How to read html from a url in python 3