Question

使用portia（scrapy）从网站提取Meta标签

我想使用portia从某些网站中提取元标记，但它没有显示头标记，它只从body标签开始

我只能从body标签中提取数据

Answer 1

您需要在body中注释元素，然后导航到要映射的head中的元素。

Answer 2

你可以将它用于元名称：

meta_name = hxs.select('//meta/@name').extract()

这是元内容：

meta_content = hxs.select('//meta/@content').extract()

这是具有特定名称的元的内容，如描述：

meta = hxs.select('//meta[@name=\'description\']/@content').extract()