在Python中使用BeautifulSoup查找字符串

时间:2012-11-12 22:09:50

标签: python beautifulsoup

我需要从这些字符串中提取“/ html / path”:

generic/html/path/generic/generic/generic

我只需要“路径”,它总是在“html /”之后。所以有一种方法可以搜索“html /”并获取字符串,直到“/”即将到来?

3 个答案:

答案 0 :(得分:6)

另一个添加到混音中的人:

In [1]: s = 'generic/html/path/generic/generic/generic'

In [2]: s.split('html/')[1].split('/')[0]
Out[2]: 'path'

答案 1 :(得分:1)

这只是基本的字符串操作

s="generic/html/path/generic/generic/generic"
i1= s.index("html/") + 5
i2= s.index("/", i1)
print s[i1:i2]

答案 2 :(得分:1)

您可以使用正则表达式:

>>> regex = re.compile(".+html/(.+?)/")
>>> r = regex.search("generic/html/path/generic/generic/generic")
>>> r.groups()
(u'path',)

Python DOC:http://docs.python.org/3.3/library/re.html