在Python中解析包含Javascript的HTML页面

时间:2014-05-19 14:57:35

标签: javascript parsing python-2.7 lxml

我正在使用 Python + lxml etree 解析HTML页面,并且我能够提取HTML标记中的所有数据。 javascript中嵌入的静态数据很少,我无法解析它。 E.g

 <td valign="top" width="80%">
    <script language="javascript" type="text/javascript">


    function AddItem() { 
    .
    .
    .
    if (st.value == 'VAL1') {
    strValues = document.getElementById('Element1').value;
                        }
    else if (st.value == 'VAL2') {
    strValues = document.getElementById('Element2').value;
                        }
    else if (st.value == 'VAL3') {
    strValues = document.getElementById('Element3').value;
                        }
    .
    .
    .
    </script>
  </td>

我想提取数据如下

{ VAL1 : Element1 , VAL2 : Element2 , VAL3 : Element3 }

如果可以使用python

,请告诉我

0 个答案:

没有答案