我正在尝试选择其中设置了特定语言的meta标签的内容:
<meta name="DC.Subject" xml:lang="en" content="Subject 1 english">
<meta name="DC.Subject" xml:lang="en" content="Subject 2 english">
<meta name="DC.Subject" xml:lang="fr" content="Subject 1 french">
<meta name="DC.Subject" xml:lang="fr" content="Subject 2 french">
如果我使用以下CSS选择器,则只能提取英语的元标记:
response.css('meta[xml\:lang="en"]::attr(content)')
但是,由于该网站还有其他元标记,例如<meta name="DC.Description" xml:lang="en" content="Description English">
和<meta name="DC.Description" xml:lang="fr" content="Description French">
,因此我需要第二个条件才能将描述与主题分开。
通常它是这样的:
response.css('meta[name="DC.Subject"] [xml\:lang="en"]::attr(content)')
但是很遗憾,这将返回一个空值。我不知道为什么在这种情况下多个条件不起作用。关于如何解决此问题的任何想法?