我正在尝试使用AzureDirectory库在Azure云存储帐户上存储Lucene.NET索引。
我使用以下版本:
并调用以下方法:
public void UpdateDocument(Term keyTerm, Document document, string indexName)
{
using (var analyser = new StandardAnalyzer(LuceneVersion))
{
using (var directory = new AzureDirectory(cloudStorage.GetStorageAccount(), indexName, new RAMDirectory()))
{
using (var indexWriter = new IndexWriter(directory, analyser, true, IndexWriter.MaxFieldLength.UNLIMITED))
{
indexWriter.UpdateDocument(keyTerm, document);
}
}
}
}
当我将该方法调用至少10次(从单元测试中)时,总时间约为30秒。
我已尝试使用索引编写器进行各种更改,以查看是否可以获得任何性能提升,但到目前为止还没有。我已经尝试更改代码以重用索引编写器和目录类,但我最终得到了文件锁。我还希望将索引代码从调用者中抽象出来,以保持Lucene的隔离。如果我评论indexWriter.UpdateDocument(keyTerm, document);
,那么它的响应能告诉我这是缓慢的地方。
我想知道我做错了什么或错过了什么?
答案 0 :(得分:0)
上面的方法只需要调整以便更好地利用资源,因为打开每个文档的目录和索引编写器成本太高。我调整后的方法运行正常:
public void UpdateDocumentBatch(Term keyTerm, IEnumerable<Document> documents, string indexName)
{
using (var analyser = new StandardAnalyzer(LuceneVersion))
{
using (var directory = new AzureDirectory(cloudStorage.GetStorageAccount(), indexName, new RAMDirectory()))
{
var createIndex = !IndexReader.IndexExists(directory);
using (var indexWriter = new IndexWriter(directory, analyser, createIndex, IndexWriter.MaxFieldLength.UNLIMITED))
{
indexWriter.SetRAMBufferSizeMB(100);
foreach (var document in documents)
{
keyTerm.Text = document.GetField(keyTerm.Field).StringValue;
indexWriter.UpdateDocument(keyTerm, document);
}
indexWriter.Commit();
}
}
}
}