如何配置crawler扩展以从tt_news中排除隐藏字段?

时间:2015-11-02 15:00:46

标签: web-crawler typo3-6.2.x tt-news

我将此配置用于tt_news的抓取工具配置:

tx_crawler.crawlerCfg.paramSets {
    items = &tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:6;]
    items {
        baseUrl = http://www.example.com
        cHash = 1
        procInstrFilter = tx_indexedsearch_reindex
    }
}

导致抓取工具索引隐藏的新闻条目。

1 个答案:

答案 0 :(得分:2)

您可以使用where子句展开配置:

tx_crawler.crawlerCfg.paramSets {
        items = &tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:6;_WHERE: and hidden = 0]
        items {
            baseUrl = http://www.example.com
            cHash = 1
            procInstrFilter = tx_indexedsearch_reindex
        }
   }

现在不会抓取所有隐藏= 1的记录。它没有记录,但在源头:

https://github.com/TYPO3-extensions/crawler/blob/master/class.tx_crawler_lib.php#L752