我正在为我的网站使用indexed_search, indexed_search_mysql
和crawler扩展程序。我在crawler
下创建了一个Crawler Configuration
记录并运行它。这会成功浏览所有页面。
配置index_enable and index_externals
设置为true
问题是index
表中没有任何已爬网的东西出现。 info>Indexed Search
将所有网页显示为“未编入索引”。
indexed_search仅在disableFrontendIndexing is set false
时有效。但为此,我必须访问每一页。
我在这里缺少其他任何配置吗?
答案 0 :(得分:3)
索引搜索仅索引缓存的页面。所以你可能想检查是否像
这样的东西config.no_cache = 1
已设定。在这种情况下,你不会得到任何索引。您还可以在浏览页面之前清除所有缓存,因此必须再次缓存它们。
如果它仍无法正常工作,您可以尝试
config.index_enable = 1
和
page.config.index_enable = 1
有所不同。
答案 1 :(得分:1)
在标准配置中,爬网程序仅将页面写入索引到队列中。你必须通过“添加进程”运行它。你做到了吗?
或cli:
/usr/bin/php /var/www/example.com/typo3/cli_dispatch.phpsh crawler
可以选择在一次运行中执行此操作:
/ usr / bin / php /var/www/example.ch/typo3/cli_dispatch.phpsh crawler_im 597 -d 9 -conf yourconfititle -o exec
此处有关cli的更多信息: