我们正在使用Google CSE(自定义搜索引擎)付费服务来索引我们网站上的内容。该站点主要由PHP页面构建,这些页面与包含文件组合在一起,但是有一些动态页面将信息从数据库提取到单个页面模板(例如新版本)。我们遇到的问题是我可以设置数据库中内容的过期日期,因此说“id = 2”会显示“此内容已过期”通知。但是,如果ID 2附加了上传的PDF,则PDF文件仍保留在搜索索引中。
我知道我可以写一个清理脚本并让cron运行它来查看数据库,找到过期的内容,检查是否附加了任何上传的文件并重命名或删除它们,但必须有一个更好的解决方案(我希望)。
如果您在过去遇到过这种情况,请告诉我,以及您的建议。
谢谢, d。
答案 0 :(得分:0)
遗憾的是,目前没有办法直接给出答案:我们不知道您的PDF如何“附加”到您的页面或数据库的结构。
最佳解决方案是创建一个robots.txt
文件,阻止您要删除的特定PDF文件的网址。谷歌将在下一次通过时将其从索引中删除(通常在一个小时左右)。
答案 1 :(得分:0)
我们最终做的是将检查脚本绑定到上传脚本,一旦完成当前上传,旧文件被“取消链接”并且数据库记录被删除。
对于我们来说,这是有效的,因为它是一种“添加/删除”的情况,我们希望按照滚动顺序显示一定数量的项目。