我发布我的问题希望有人可以帮助我, 我试图抓住所有具有机器人属性的链接 使用cheerio我向网址发出请求,它会在字符串中找回一个html页面。
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>test</title>
</head>
<body>
<a href="google.fr" class="test"></a>
<a href="yahoo.com" class="test"></a>
<a href="amazon.fr" class="test"></a>
<a href="linux.org" class="test"></a>
<a href="facebook.com" class="no_select"></a>
<a href="twitter.com" class="no_select"></a>
</body>
</html>
我试过这样的事情
const cheerio = require('cheerio');
const page = `<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>test</title>
</head>
<body>
<a href="google.fr" class="test"></a>
<a href="yahoo.com" class="test"></a>
<a href="amazon.fr" class="test"></a>
<a href="linux.org" class="test"></a>
<a href="facebook.com" class="no_select"></a>
<a href="twitter.com" class="no_select"></a>
</body>
</html>`
const $ = cheerio.load(page)
const links = $('.test').each( (index, elem) =>{
console.log(elem);
});
console.log(links);
但没有取得很大的成功。
我正在寻找一个解决方案来检索一个数组,每个元素都是href属性,这是一个使用cheerio的测试类的链接。
谢谢你的帮助=)
答案 0 :(得分:0)
我终于找到了解决方案
const cheerio = require('cheerio');
const page = `<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>test</title>
</head>
<body>
<a href="google.fr" class="test"></a>
<a href="yahoo.com" class="test"></a>
<a href="amazon.fr" class="test"></a>
<a href="linux.org" class="test"></a>
<a href="facebook.com" class="no_select"></a>
<a href="twitter.com" class="no_select"></a>
</body>
</html>`
const $ = cheerio.load(page)
const links = $('.test').each( (index, elem) =>{
console.log(elem.attribs.href);
});
这是工作,抱歉打扰。