为什么HTML表格元素有标签和换行符只是为了便于阅读

时间:2012-05-31 01:01:08

标签: html parsing nokogiri html-table

我正在尝试阅读/解析网页。一些表元素似乎有许多选项卡和换行符。

很奇怪为什么一些单词前面有tab /换行符。

2 个答案:

答案 0 :(得分:2)

它的可读性和可维护性。它有助于识别块级别和容器元素,并确保开始标记具有结束标记。基本上它是为了让开发人员的生活更轻松,因为浏览器不关心缩进。

答案 1 :(得分:0)

您可能会看到如下标记:

<table id="stuff">
  <tbody>
    <tr>
      <td>
        Hello World!
      </td>
    </tr>
  </tbody>
</table>
doc = Nokogiri.HTML(some_string)
p doc.at('#stuff td').text
#=> "\n\t\t\t\tHello World!\n\t\t\t"

如您所见,这确实是该单元格的文本内容。