我将此配置用于tt_news的抓取工具配置:
tx_crawler.crawlerCfg.paramSets {
items = &tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:6;]
items {
baseUrl = http://www.example.com
cHash = 1
procInstrFilter = tx_indexedsearch_reindex
}
}
导致抓取工具索引隐藏的新闻条目。
答案 0 :(得分:2)
您可以使用where子句展开配置:
tx_crawler.crawlerCfg.paramSets {
items = &tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:6;_WHERE: and hidden = 0]
items {
baseUrl = http://www.example.com
cHash = 1
procInstrFilter = tx_indexedsearch_reindex
}
}
现在不会抓取所有隐藏= 1的记录。它没有记录,但在源头:
https://github.com/TYPO3-extensions/crawler/blob/master/class.tx_crawler_lib.php#L752