我正在评估OSS以实现对中型ASP.NET(MVC4)网站的抓取,索引和搜索。
到目前为止看起来很有希望。
以下是一些我在文档中找不到的基本问题:
德国变音符号:
渲染器/搜索德国变形金刚'ä,ü,ö'失败:
http://localhost:8080/renderer?use=haas&name=gSearch&query=küche
返回
"küche in the search box with no results - there should be results in the index!"
(我使用language = German
OSS可以返回同义词,如“......你的意思是......”而不必手动插入每个可想到的或不可思议的同义词吗?
在Schema-> Parser_list->中添加“aspx”之前,我没有得到结果。 HTML - >支持的扩展
这是正确的 - 或者我应该为ASP添加另一个解析器 - ...我可以为HTML,ASP,PDF等提供多个解析器......?
完成后3.我得到了结果 - 包括aspx和pdf文档......但我没有获得PDF文件的可点击链接(文件名)?
从MVC调用搜索的最佳方式是什么?通过Webservices ...?我不想包含IFRAME
答案 0 :(得分:0)
我使用WebRequest,非常简单。
var webRequest = WebRequest.Create("http://localhost:8080/select?use=haas&query=kitchen");
webRequest.Timeout = 10000;
WebResponse webResponse;
try
{
webResponse = webRequest.GetResponse();
}
catch (WebException ex)
{
WriteToEventLog(ex.Message);
}
var xmlStream = webResponse.GetResponseStream();
var reader = XmlReader.Create(xmlStream);
var doc = XDocument.Load(reader, LoadOptions.PreserveWhitespace);
然后,您自己拥有一个XML,其中包含在OSS索引查询中设置的返回字段。