我在Account
模型上定义了一个简单的Thinking Sphinx索引:
define_index do
indexes display_name
indexes email_addresses.email_address
has created_at
set_property :delta => :datetime, :threshold => 2.minutes
end
(暂时忽略delta;我正在生成完整索引并搜索account_core
。)
但是我得到了一些意想不到的结果:
>> Account.count
# => 885138
>> Account.search.total_entries
# => 260795
>> Account.search("lenny@paperlesspost.com")
# => []
但是,在命令行中,使用search
实用程序,我能够找到Lenny:
$ search -c /etc/sphinx/water.sphinx.conf -i account_core drew@example.com
index 'account_core': query 'drew@example.com.com ': returned 2 matches of 2 total in 0.759 sec
displaying matches:
1. document=3543432, weight=4, sphinx_internal_id=442101, sphinx_deleted=0, class_crc=0, created_at=Mon Apr 11 12:18:08 2011
2. document=5752816, weight=2, sphinx_internal_id=719552, sphinx_deleted=0, class_crc=0, created_at=Tue Dec 27 12:01:12 2011
实际上这些是Drew的帐户ID。
为什么在使用Thinking Sphinx进行搜索时无法找到Lenny?为什么total_entries
数字比accounts
表中的总行数小得多?
答案 0 :(得分:1)
事实证明,这个问题与Thinking Sphinx如何处理单表继承有关。 TS仅返回具有与父类的子类之一对应的type
的记录。如果type
为NULL
,则该文档不会包含在搜索结果中。我们在accounts
表中有type=NULL
的记录很多。修复数据后,现在搜索按预期工作。
感谢#sphinxsearch中的roman3x指向我。