来自多个文件夹的solr-index

时间:2012-04-10 08:40:12

标签: solr indexing

我正在尝试使用solr制作网络搜索应用程序,但我遇到了问题。问题是在我遵循的示例中,所有文件都在同一个文件夹中。但我想索引来自不同目录的文件(即给出根文件夹并索引所有子目录中的所有xml文件)。这可能吗?

2 个答案:

答案 0 :(得分:0)

在shell脚本中尝试此操作(未经测试):

#!/bin/sh

FILES=$(find . -iname "*.xml")
URL=http://localhost:8983/solr/update

for f in $FILES; do
  echo "Posting $f"
  curl $URL --data-binary @$f -H 'Content-type:application/xml' 
  echo
done

#send the commit command to make sure all the changes are flushed and visible
curl $URL --data-binary '<commit/>' -H 'Content-type:application/xml'
echo

将其放在您拥有xml文件的根文件夹中。

(我假设您有linux并且'post.sh'脚本是您遵循的示例)

答案 1 :(得分:0)

尝试使用SimplePostTool递归选项:

java -Dauto -Drecursive -jar post.jar