从HTML-Python中提取第三个关键字后的数据(数字)

时间:2015-07-30 14:03:47

标签: python html regex beautifulsoup

我想提取关键字'data:'后面的长码的一部分。

[u'\n\t\tvar chart_id = chart_ID\n\t\tvar series = [\n                          \n                          {\'data\': [[1437694800000.0, 36.19, 36.19, 36.19, 36.19], [1437697200000.0, 36.19, 36.19, 36.19, 36.19],...}   
{\'data\': [[1437703800000.0, 10.0], [1437703860000.0, 10.0], [1437707400000.0, 1.0], [1437707520000.0, 7.0], [1437707580000.0, 3.0],... } #starts with new object 'data:'and different set of numbers... and so on...

问题是较长的代码中存在类似的数据结构('数据'+数字),我只对第三次出现感兴趣。

我是正则表达式的初学者,无法弄清楚如何。

到目前为止,我提出了:

data_string = 'code above'
num = re.findall(r"\[(.*?)\]", data_string)

它为我提供了'数据'的每个数据集(我只想要第三个)

我怎样才能获得第三个数据集(只是数字)?

0 个答案:

没有答案