从Solr获取数据并将其加载到Python Dataframe

时间:2017-03-23 10:08:38

标签: python-3.x solr

我从Oracle 11g到Solr获取了大约5万行。

现在我想从Solr到python Dataframe获取相同内容。

我使用了以下内容:

import pandas as pd
import pysolr

r = pysolr.Solr('http://localhost:8983/solr/db')

result = r.search('*')  

docs = pd.DataFrame(result.docs)

result = r.search('*')#Its抛出错误SolrError:Solr响应错误(HTTP 504):[原因:无] 504Gateway超时

网关超时

服务器错误 - 此时无法访问服务器127.0.0.1。

请重试请求或联系您的管理员。

我是Solr的新手。在此先感谢

1 个答案:

答案 0 :(得分:2)

您会收到pysolr.Results

类型的结果

使用函数来获取所需的内容,例如qtime,docs,facets

results.docs列出所有文档,可以使用type(results.docs)

进行检查

results.docs[0]为您提供结果中的第一份文件。属于dict类型。

要将其导入DataFrame导入pandas库并使用DataFrame()

import pandas as pd
import pysolr
solrcon = pysolr.Solr('http://localhost:8983/solr/db', timeout=10)
results = solrcon.search('*:*')
docs = pd.DataFrame(results.docs)