" 1年前由bagelpirate提交至/ r / books"
基本上我正在学习网页抓取,我从reddit页面的html中提取了这些信息。我需要得到"百吉饼"超出这个字符串。有没有办法在python中这样做?
答案 0 :(得分:0)
In [84]: s = "submitted 1 year ago by bagelpirate to /r/books"
In [85]: s.replace("bagelpirate", '')
Out[85]: 'submitted 1 year ago by to /r/books'
答案 1 :(得分:0)
给出起始字符串:
s = "submitted 1 year ago by bagelpirate to /r/books"
你可以这样做(找到前后子串的位置):
name = s[s.index(' by ')+4:s.index(' to /r/books')]
或者您可以使用正则表达式:
import re
name = re.search(' by (.+) to /r/books', s).group(1)
这意味着,通过(某物)找到" / r / books"在字符串中,给我括号括起来的部分'。
这取决于你获得的字符串究竟是什么格式。