Nokogiri:如何解析文本片段?

时间:2011-09-14 16:10:00

标签: ruby nokogiri

我有这样的例子:

html= <<EOT
<div>Some text1
  <p>Some text2</p>
</div>
EOT
doc = Nokogiri::HTML(html)
puts doc.css('div').text

这样做:

Some text1
  Some text2

但我只需要“一些text1”

2 个答案:

答案 0 :(得分:2)

doc.css('div').children.first.text
# => "Some text1\n  "

doc.css('div').children.first.text.rstrip
# => "Some text1" 

答案 1 :(得分:1)

一个XPath表达式和一个strip将帮助您:

some_text1 = doc.xpath('//div/text()[1]').text.strip