如何直接在elasticsearch服务器上索引xml数据

时间:2016-04-21 06:09:24

标签: ruby-on-rails ruby xml elasticsearch

我有近250个XML数据文件(一个文件包含1000对xml格式的数据),我有一个弹性搜索服务器。我的应用程序构建在Ruby on Rails平台上。我知道如何在rails应用程序(ModelName.import)中对Model进行索引,它将在elasticsearch服务器上执行索引。

但是有没有其他方法可以直接使用elasticsearch服务器上的XML数据文件进行索引而不是使用.import方法?

XML文件看起来像(XML文件每个文件可能包含1000个项目),

<?xml version="1.0" encoding="UTF-8"?>
<catalog items="2" total-pages="260" page="1" per-page="2" status="complete">
<item>
<sku>1</sku>
<vbid>1</vbid>
<created>Sun, 05 Oct 2014 03:35:58 +0000</created>
<updated>Sun, 06 Mar 2016 12:44:48 +0000</updated>
<subjects>
  <subject schema="bisac" code="HIS027090">World War I</subject>
  <subject schema="coursesmart" code="cs.soc_sci.hist.milit_hist">Social Sciences -&gt; History -&gt; Military History</subject>
</subjects>
<aliases>
  <eisbn-canonical>1</eisbn-canonical>
  <isbn-canonical>1</isbn-canonical>
  <print-isbn-canonical>9780752460864</print-isbn-canonical>
  <fpid/>
  <isbn13>1</isbn13>
  <isbn10>0750951796</isbn10>
  <additional-isbns>
    <isbn type="print-isbn-10">0752460862</isbn>
    <isbn type="print-isbn-13">9780752460864</isbn>
  </additional-isbns>
</aliases>
</item>
<item>
<sku>2</sku>
<vbid>2</vbid>
<created>Sun, 05 Oct 2014 03:35:58 +0000</created>
<updated>Sun, 06 Mar 2016 12:44:48 +0000</updated>
<subjects>
  <subject schema="bisac" code="HIS027090">World War I</subject>
  <subject schema="coursesmart" code="cs.soc_sci.hist.milit_hist">Social Sciences -&gt; History -&gt; Military History</subject>
</subjects>
<aliases>
  <eisbn-canonical>2</eisbn-canonical>
  <isbn-canonical>2</isbn-canonical>
  <print-isbn-canonical>9780752460864</print-isbn-canonical>
  <fpid/>
  <isbn13>2</isbn13>
  <isbn10>0750951796</isbn10>
  <additional-isbns>
    <isbn type="print-isbn-10">0752460862</isbn>
    <isbn type="print-isbn-13">9780752460864</isbn>
  </additional-isbns>
</aliases>
</item>
</catalog>

0 个答案:

没有答案