Question

我正在尝试制作能够读取网页的内容，然后从那里获取内容并在网页内搜索某些内容并仅复制该内容。我不知道如何让它只复制我想要的那么多字符串。为了使事情变得更难，网页上没有任何CSS，只是文字。
对于我想要使用的东西，正在阅读的代码是

"Token":"5acd163ee08b41b801e0863889111e334b5dd8c2e4f0","ID":4,"

我希望输出只是：

5acd163ee08b41b801e0863889111e334b5dd8c2e4f0

Answer 1

如果格式始终保持不变且只有值在上面的表达式中发生变化，则此正则表达式将返回Token值：

text = '"Token":"5acd163ee08b41b801e0863889111e334b5dd8c2e4f0","ID":4," '
m = re.search(r'"Token":"([\w]+)"', text)
m.groups()[0]
>>> '5acd163ee08b41b801e0863889111e334b5dd8c2e4f0'

Answer 2

非正则表达方式，使用优秀的requests library：

import requests

g = requests.get('http://www.example.com/some-file.txt')
print(g.text.split(',')[0].split(':')[1])

从String Python中拉出文本

2 个答案: