将htm页/表解析为json,nodejs

时间:2017-12-16 17:40:39

标签: json node.js html-parsing

我正在搜索解决方案,将html表解析为json:

 <div id="content">
    <h1>content-information</h1>
              <table class="testinformation">
        <thead>
            <tr>
                <th>hello</th>
                <th>test_text</th>
            </tr>
        </thead>
        <tbody>
            <tr>
                <td><a href="https://example.com">hello1</a></td>
                <td><a href="https://example.com/test_text">test_text</a></td>
            </tr>
            <tr>
                <td><a href="https://example.com">hello2</a></td>
                <td><a href="https://example.com/test_text2">test_text2</a></td>
            </tr>            
        </tbody>
    </table>
  </div>

尝试过cheerio,cherrio-tableparser,但没有成功......

1 个答案:

答案 0 :(得分:0)

您可以尝试使用node-html-to-json

它易于使用且记录良好。