我是C#开发人员,去年我接手了一些正在工作的项目,这些项目完全是用Oracle建立的。我有0个使用oracle的经验。 突然,这些网站在Google上可见,因此不应该... 谁能帮助我避免这种情况?
我知道“ robots.txt”,但我不知道将其放在Oracle中的哪个位置。我们很难找到根。 Oracle是否有解决此问题的特殊方法?还是有人知道其他替代解决方案?
只要有帮助,它们都位于子域中。
答案 0 :(得分:0)
我想,正在使用一些Oracle CMS,例如WebCenter Content。任何CMS,不仅Oracle的任何CMS都具有内置元数据管理。即使没有,也应该可以访问引擎,该引擎将从数据库或XML内容生成HTML。
我要做什么-我将在Oracle CMS的后端中搜索某些内容,您可以在其中管理每个Web文档的元数据。获取后,将漫游器元标记<meta name="robots" content="noindex, nofollow">
添加到每个Web文档的元数据中。就是这样。
如果Web文档的内容保存在数据库中,请查找包含Web文档内容的表-如果其标题分别保存在数据库中,请查找它们。然后,使用我在上面写的meta robots标签,对该表的每一行运行INSERT查询。
我可以想象,在INSERT查询之后,您将被迫重新呈现所有Web文档-这样做以使新的标题内容出现。
另一种可行的方法是在Web服务器上创建X-Robots-Tag(如果Tomcat和Web之间存在任何Apache或Nginx),然后将“ noindex,nofollow”规则放入X-Robots-Tag。 。 Tomcat(或类似产品)是否支持X-Robots-Tag或类似产品-我不知道。