使PDF可在Google上搜索的问题

时间:2011-08-09 15:51:53

标签: c# pdf mongodb

我一直在研究各地,我似乎无法找到如何在Google上搜索我的文档而不将其直接添加到我的网站。这是我的目标...如果有人能帮助我实现它,我会非常感激它...因为我在这一点上有点沮丧。

目标:

我需要让我的文档库可供Google搜索。我已经走了使用SharePoint来保存我的文档的路线,但由于我们需要用户名和密码以便您检索文档而导致Google无法进入,因此我们已经排除了这一点。因此我们更改了路线并决定使用MONGO db到目前为止我仍然无法使我的PDF可以搜索(mongo不需要登录凭据,但它不在DMZ上,它位于防火墙后面,但有一个端口允许访问它... < / p>

步骤。 1我使用的是ASP.net C# 2我在mongo中有一个pdf,它是无密码的,可以访问Google 3我有一个站点地图,我已经提交给谷歌这些pdf链接的页面。 4。我正在使用链接按钮来访问Mongo中的文件以及直接访问我站点中的pdf的文件。 到目前为止,这里有结果和细节:

我有4个测试用例...

案例1:mongo中的PDF与pdf中的文本似乎只选择所有(锁定)通过链接按钮检索(此一个不可搜索)

Mongo pdf

<asp:LinkButton ID="lbClick" runat="server" onclick="lbClick_Click">Click Me</asp:LinkButton>

案例2:带有pdf中文字的PDF能够通过链接按钮复制正在检索的内容的任何部分(现在可以在Google上搜索这个部分,但我的网站不能选择容纳所有PDF文件)网站,这只是一个测试,以确保我们可以搜索pdf)

网站上的PDF

   <asp:LinkButton ID="lbnOnSite" runat="server" onclick="lbnOnSite_Click">Click Here</asp:LinkButton>

案例3:pdf中带有文本的PDF能够通过标签复制正在检索的内容的任何部分(这个奇怪的是不可搜索的,我很困惑为什么,我会想,如果有任何这个会工作没有我读过的所有内容之后的问题)

test searchable pdf 
<a href="/endobiop.pdf"> Click Me</a>

案例4:pdf中的Mongo文本中的PDF能够通过链接按钮复制正在检索的内容的任何部分。 (这个不可搜索)

 Mongo Test 2 
<asp:LinkButton ID="LinkButton1" runat="server" 
    onclick="LinkButton1_Click">Click Me</asp:LinkButton>

我想补充的另一件事是,在我完成的所有研究中,似乎需要时间在Google上对文件进行索引,并且需要在PDF上打开一次网站......所以我的问题是你如何等待? 1周,1个月,1年,一生...基本上我不知道什么时候我知道我的测试失败了。

0 个答案:

没有答案