我想从中获取子字符串
<tableScreenletid="xyz"label="xxyyzz">
介于 id =&#34; 和&#34; label = 之间
即,应该看起来像:
xyz
答案 0 :(得分:1)
找到第一个字符串“end”索引和第二个字符串“start”索引。 获取索引位置使用索引函数。使用这些索引来获取子字符串。
startSTR = "id="
endSTR = "label"
delimitedLen = 1 #Only to exclude
substr = str[(str.index(startSTR)+len(startSTR)+delimitedLen):str.index(endSTR)-delimitedLen]
print substr
``
答案 1 :(得分:0)
您希望使用BeautifulSoup。
以下是如何做你想做的事:
new_data = pd.DataFrame()
new_data['tsneY'] = df['tsneY'].values.tolist()
> new_data
tsneY
0 20.740931
1 18.478468
2 22.948167
3 15.738954
2旁注:
1 :如果您的字符串包含多个标签,则可以使用from BeautifulSoup import BeautifulStoneSoup as ssoup
mysoup = ssoup('<table Screenletid="xyz" label="xxyyzz">')
print mysoup.find('table')['screenletid']
功能。这是一个简短的例子:
findAll
2 :您还可以将条件传递给find语句。以下语句仅返回带有标签&#34; b&#34;:
的表格mysoup = ssoup('<table Screenletid="1" label="a"><table Screenletid="2" label="b">')
for a_table in mysoup.findAll('table'):
print a_table['screenletid']
答案 2 :(得分:-1)