我正在创建一个python中的程序,它接受用户输入的字典单词列表(用逗号或单独的行分开),然后将每个单词添加到URL的末尾(http://steamcommunity.com/id/然后,它检查每个URL,并仅打印“无法找到指定的配置文件”的URL。网页上的文字(例如http://prntscr.com/gjdzuf),我明白这很可能并不是很困难,但我最近才开始学习python,而我只是在寻找最简单的方法来做我想要实现的目标,任何有用的反馈是赞赏片段,建议等,谢谢:)
答案 0 :(得分:1)
您正在寻找requests
模块。对于像检查文本是否在页面中一样简单的事情,这样做:
import requests
r = requests.get('http://steamcommunity.com/id/')
if 'The specified profile could not be found.' in r.text:
print('Invalid profile!')
else:
print('Found a profile.')
对于更复杂的处理,需要一个解析库,例如BeautifulSoup4
。
这种做法被称为“网络抓取”,Python有很好的工具。