我正在尝试制作能够读取网页的内容,然后从那里获取内容并在网页内搜索某些内容并仅复制该内容。我不知道如何让它只复制我想要的那么多字符串。为了使事情变得更难,网页上没有任何CSS,只是文字。
对于我想要使用的东西,正在阅读的代码是
"Token":"5acd163ee08b41b801e0863889111e334b5dd8c2e4f0","ID":4,"
我希望输出只是:
5acd163ee08b41b801e0863889111e334b5dd8c2e4f0
答案 0 :(得分:1)
如果格式始终保持不变且只有值在上面的表达式中发生变化,则此正则表达式将返回Token值:
text = '"Token":"5acd163ee08b41b801e0863889111e334b5dd8c2e4f0","ID":4," '
m = re.search(r'"Token":"([\w]+)"', text)
m.groups()[0]
>>> '5acd163ee08b41b801e0863889111e334b5dd8c2e4f0'
答案 1 :(得分:0)
非正则表达方式,使用优秀的requests
library:
import requests
g = requests.get('http://www.example.com/some-file.txt')
print(g.text.split(',')[0].split(':')[1])