是否有一个替代的html5ever库,它接受一个字符串并返回一个可查询的对象?

时间:2016-02-13 06:46:06

标签: html rust

我正在尝试解析Rust中的HTML。似乎这样做的一个库是html5ever。我找不到任何简单的方法来使它获取一个字符串并返回一个可查询对象。

是否有一个我可以使用的替代库,它接受一个字符串并返回一个我可以查询的对象?

我正在尝试做网络抓取这样的事情。

我是一个完整的Rust新手。

1 个答案:

答案 0 :(得分:11)

您可以使用select crate,它基本上是html5ever的包装器,但提供了更好的api。

例如:

use select::document::Document;
use select::predicate::Name;

for i in Document::from_str(html_src_string).find(Name("article")).iter() {
    println!("{:?}",i.text() );       //prints text content of all articles
};

select.rs存储库有更详尽的示例。