感谢您抽出时间来阅读本 我想知道是否有什么办法,我可以从不同环节的特定代码,但它们都是同一个域的我的意思是,如果我把很多的Facebook页面上的链接它得到他们的名字在文本文件中,每个人在不同的行
答案 0 :(得分:1)
我想如果我理解您需要链接中的用户名。
facebook.com/zuck
acebook.com/moskov
您可以跟踪并提取页面标题,这可能并不总是准确的。
> <title id="pageTitle">Mark Zuckerberg</title>
> <title id="pageTitle">Dustin Moskovitz</title>
html2text是一个Python脚本,可将HTML页面转换为清晰易读的纯ASCII文本。更好的是,ASCII也恰好是有效的Markdown(文本到HTML格式)。 https://github.com/Alir3z4/html2text
如果您想阅读网址,请检查以下说明 How to read html from a url in python 3