我想使用solr的DIH deltaimport导入由nutch导出的mysql数据,但是来自nutch的mysql数据没有时间戳字段。 我尝试从Mysql导入的原因是我想将爬网数据与其他url管理表结合起来。 爬网数据中的“modifiedTime”字段是bigInt而不是timeStamp,并且始终为Null。 我检查了这个问题,我认为索引过滤器插件可以解决这个问题。是不是?
nutch 2.1 Solr 3.6
答案 0 :(得分:0)
尝试使用ScriptTransformer在索引之前转换每个不均匀的数据,我希望这个URL对您有用:http://wiki.apache.org/solr/DataImportHandler#ScriptTransformer