使用Nokogiri的CSS方法获取团队页面中的所有名称

时间:2016-08-24 00:22:20

标签: html css ruby xml nokogiri

我正在尝试使用Nokogiri的CSS方法从我的HTML中获取一些名称。

这是HTML的一个例子:

<section class="container partner-customer padding-bottom--60">
    <div>
        <div>
            <a id="technologies"></a>
            <h4 class="center-align">The Team</h4>
        </div>
    </div>
    <div class="consultant list-across wrap">
        <div class="engineering">
            <img class="" src="https://v0001.jpg" alt="Person 1"/>
            <p>Person 1<br>Founder, Chairman &amp; CTO</p>
        </div>
        <div class="engineering">
            <img class="" src="https://v0002.png" alt="Person 2"/></a>
            <p>Person 2<br>Founder, VP of Engineering</p>
        </div>
        <div class="product">
            <img class="" src="https://v0003.jpg" alt="Person 3"/></a>
            <p>Person 3<br>Product</p>
        </div>
        <div class="Human Resources &amp; Admin">
            <img class="" src="https://v0004.jpg" alt="Person 4"/></a>
            <p>Person 4<br>People &amp; Places</p>
        </div>
        <div class="alliances">
            <img class="" src="https://v0005.jpg" alt="Person 5"/></a>
            <p>Person 5<br>VP of Alliances</p>
        </div>

到目前为止,我在people.rake文件中的内容如下:

  staff_site = Nokogiri::HTML(open("https://www.website.com/company/team-all"))
  all_hands = staff_site.css("").map(&:text).map(&:squish)

我在alt=""标记(人名)中获取所有元素时遇到一些麻烦,因为它嵌套在几个div之下。我想知道是否有人可以给我一些帮助?

0 个答案:

没有答案