Solr计数不正确

时间:2017-03-03 02:43:13

标签: solr apache-zookeeper solrcloud cassini

背景:我们的<?php require_once("dompdf_config.inc.php"); $html="<h1>sdfsdff</h1>"; $dompdf = new DOMPDF(); $dompdf->load_html($html); $dompdf->render(); $output = $dompdf->output(); $name = "Name goes here"; $email = "abcl@gmail.com"; $to = "$name <$email>"; $from = "John-Smith "; $subject = "Here is your attachment"; $mainMessage = "Hi, here's the file."; $fileatt = $output; $fileatttype = "application/pdf"; $fileattname = "output.pdf"; $headers = "From: $from"; // File $file = fopen($fileatt, 'rb'); $data = fread($file, filesize($fileatt)); fclose($file); // This attaches the file $mime_boundary = "==Multipart_Boundary_x{$semi_rand}x"; $headers .= "\nMIME-Version: 1.0\n" . "Content-Type: multipart/mixed;\n" . " boundary=\"{$mime_boundary}\""; $message = "This is a multi-part message in MIME format.\n\n" . "-{$mime_boundary}\n" . "Content-Type: text/plain; charset=\"iso-8859-1\n" . "Content-Transfer-Encoding: 7bit\n\n" . $mainMessage . "\n\n"; $data = chunk_split(base64_encode($data)); $message .= "--{$mime_boundary}\n" . "Content-Type: {$fileatttype};\n" . " name=\"{$fileattname}\"\n" . "Content-Disposition: attachment;\n" . " filename=\"{$fileattname}\"\n" . "Content-Transfer-Encoding: base64\n\n" . $data . "\n\n" . "-{$mime_boundary}-\n"; // Send the email if(mail($to, $subject, $message, $headers)) { echo "The email was sent."; } else { echo "There was an error sending the mail."; } ?> 台机器中有2台机器人被抢断,导致我的Zookeeper系统崩溃。我添加了新的SOLR计算机并使用新的Zookeeper计算机更新了每个SOLR计算机配置。

在此之后,我启动了Zookeeper并使用管理页面查询SOLR,每次查询池时都会返回不同的数字。

因此,我清除了*:*云中的所有记录并运行了SOLR以再次将所有数据从Oracle填充到SOLR。 (一切都很好看。)

问题:我每天batch-jobbatchjob更新SOLR DELTA(Inserts + Updates)

从此实例开始。 Oracle池中的数字与SOLR不匹配。例如:即使一天更新或插入1000条记录,SOLR计数相差超过10000条。

DELTA(insert + update)返回的数字不匹配。我们已经多次尝试清除记录。当我们在清除后第一次插入记录时,事情看起来很好,但是一旦更新开始发生,数字就不匹配了。

没有重复记录。如果我查询特定记录,我们得到正确的记录,但方面数字也是错误的。

索引文件是否已损坏?

1 个答案:

答案 0 :(得分:0)

尝试优化索引。我也面临同样的问题,并优化索引修复它。

      curl http://hostname:8980/solr/<core>/update?optimize=true

有关优化的更多信息:

http://wiki.apache.org/solr/SolrPerformanceFactors#Optimization_Considerations

PS:请注意优化是昂贵的。你不应该每天运行一次以上。