标签: apache lucene compass-lucene
我得到了一个15GB的平面文件提取及其规范,它有助于识别每一行记录以及如何分割每一行以收集所需信息。我打算使用ETL工具,因为我认为这个批量文件的文本处理无法在java中实现。但我现在开始阅读Lucene。现在真的很困惑。以下是我的疑惑: