我想通过在网站上查找某些特定数据来抓取该网站。 web scrapper是否支持关键字属性,例如:我想提取包含单词Java,PHP developper的所有数据。是否有一些网络抓取工具可以支持这些属性?
答案 0 :(得分:1)
基本上没有特殊的关键字抓取工具。但你可能会模仿他们。
<案例1您认为html head部分meta
包含关键字:
<html>
<head>
<meta name="keywords" content="java, php, python, linux">
<head>
<html>
1。不是整个网页,而是它的一部分 - 前1000个字符。
/java|php|linux|python/gi
网页上没有关注关键字的元数据。 :-( 只需使用正则表达式(参见上文)检索整个页面文本中的关键字状态检查,即可进行常规页面内容检索。