用于抓取网站并检索每个页面的所有元信息的在线工具

时间:2009-04-21 10:07:25

标签: seo web-crawler meta-tags

是否有人知道可以抓取任何指定网站并仅返回元关键字和元描述信息的免费在线工具?

2 个答案:

答案 0 :(得分:2)

假设您可以访问Linux / Unix:

mkdir temp
cd temp
wget -r SITE_ADDRESS

然后,对于关键字:

egrep -r -h 'meta[^>]+name="keywords' * | sed 's/^.*content="\([^"]*\)".*$/\1/g'

和描述:

egrep -r -h 'meta[^>]+name="description' * | sed 's/^.*content="\([^"]*\)".*$/\1/g'

如果您想要所有唯一关键字,请尝试:

egrep -r -h 'meta[^>]+name="keywords' * | sed 's/^.*content="\([^"]*\)".*$/\1/g' | sed 's/\s*,\s*/\n/g' | sort | uniq

我确信那里有一个单行或程序可以做到这一点,并且肯定会有更简单的答案。

答案 1 :(得分:1)

要检索所有元信息,请尝试使用此工具Meta Tags Analyzer