该网站几乎完全是d / x / html,并且托管在linux / apache服务器上。
虽然我并不反对使用数据库,但我被告知我可以实现一个解析器来解析html文档并返回我的搜索结果而不会过多地使用asp / php / cgi(我是我当然是新手。)
这可能吗?有没有更好的办法?我应该查看特定的第三方应用程序吗?
感谢!!!
答案 0 :(得分:3)
您还可以向Google付费,让其抓取您的网站并展示自定义搜索结果,而不是为搜索设备付费。它价格便宜,谷歌可以很好地索引所有内容(包括PDF)。如果我没记错的话,它的广告支持版本是免费的(即您付费删除广告)
答案 1 :(得分:1)
有“蜘蛛”会抓取您的网站并生成某种形式的搜索索引。这些是多么可靠以及它们的表现如何我真的不能说。我们最近在这里购买了两个Google搜索设备,其中一个用于我们的内部网,一个用于我们的外部网。他们可以很好地为您想要的内容编制索引,并设置专门的“搜索区域”甚至是关键字映射。
我强烈推荐他们:http://www.google.com/enterprise/mini/
答案 2 :(得分:1)
谷歌搜索是最简单的路线。我建议的唯一一件事就是将谷歌站点地图添加到您的站点。这样您就可以通知谷歌更新或新页面,以确保搜索列表尽可能是最新的。
答案 3 :(得分:1)
如果您可以用您喜欢的编程语言编写一些代码,您还可以查看Apache Solr(url)。这个概念很简单:你得到一个单独的Search-Server,已经实现并作为一个单独的程序。您可以通过发布(HTTP-Post)将文档放入Search-Server。您可以通过发出GET-Request并使用搜索结果获取XML文件来进行搜索。
你要写的是将文件发送到搜索搜索的代码(只有一些代码行)和解析xml-search-results(可以用xslt轻松完成)
我不知道你说的文件有多少,但是这个解决方案非常好,我目前在索引中使用2.5 Mio页面并在50 ms内得到结果。
答案 4 :(得分:0)
添加指向Google的链接,该链接仅返回您的域的结果(带有site:
分隔符)。我不知道怎么做,但不应该很难
答案 5 :(得分:0)
谢谢大家!我目前正在寻找谷歌自定义搜索引擎。带有徽标的搜索栏很麻烦,但是如果所有google都希望通过水印搜索栏和几个广告投放,那么这就是我的解决方案!
答案 6 :(得分:0)
以下是我在博客上进行搜索的方式(使用Google)...不记得我最初从哪里获得此模板,但是从评论中我猜它最初来自javascriptkit.com。 :)
<script type="text/javascript">
// Google Internal Site Search script- By JavaScriptKit.com(http://www.javascriptkit.com)
// For this and over 400+ free scripts, visit JavaScript Kit-http://www.javascriptkit.com/
// This notice must stay intact for use
//Enter domain of site to search.
var domainroot="ericasberry.com"
function Gsitesearch(curobj)
{
curobj.q.value="site:"+domainroot+" "+curobj.qfront.value
}
</script>
<form action="http://www.google.com/search" method="get"
onSubmit="Gsitesearch(this)">
<p>Search ericasberry.com:<br />
<input name="q" type="hidden" />
<input name="qfront" type="text" style="width: 180px" />
<input type="submit" value="Search" /></p>
</form>
答案 7 :(得分:0)
Google Ajax Search API