为什么原始的html内容在被浏览器打开时被修改?

时间:2019-04-16 18:52:02

标签: html html5 dom browser

我有一些HTML内容,我需要获取结构上某些元素的确切XPATH,但是当浏览器打开HTML时,原始结构已被修改,因此我会基于浏览器的结构以及何时获取XPATH原始内容将在我的末端处理,XPATH不起作用或不匹配。

我在Google Chrome和Firefox上进行了尝试,并且得到了相同的行为。

原始HTML

<!DOCTYPE html>
<html>

<head>
    <title>Title</title>
</head>

<body>
    <div>
        <table>
            <div>
                <div> <img
                        src="https://cdn.shopify.com/s/files/1/0255/4105/products/Classic-Ear-Cuff-Gold_72a095ad-b344-49b6-8b4a-5335304f09bc_160x160_cropped@3x.jpg?v=1548871945" />
                </div>
                <div>
                    <h2>Ring</h2>
                </div>
            </div>
            <table>
                <tr>
                    <td> something </td>
                </tr>
            </table>
        </table>
    </div>
</body>

</html>

浏览器的HTML

<!DOCTYPE html>
<html>

<head>
    <meta http-equiv="content-type" content="text/html; charset=UTF-8">
    <title>Title</title>
</head>

<body>
    <div>
        <div>
            <div> <img src="Result_files/Classic-Ear-Cuff-Gold_72a095ad-b344-49b6-8b4a-5335304f09bc_1.jpg">
            </div>
            <div>
                <h2>Ring</h2>
            </div>
        </div>
        <table>
        </table>
        <table>
            <tbody>
                <tr>
                    <td> something </td>
                </tr>
            </tbody>
        </table>
    </div>
</body>

</html>

我可以在浏览器上防止这种行为吗?或是否存在任何已知规则为何应用此修改?

0 个答案:

没有答案