假设我想构建一个组织可以提供的关于自己的专门信息目录。我们同意元数据标准,并将这些信息包含在网站上。
是否有可能以某种方式使用Google的基础架构来解决使用该元数据发现网站的问题,并定期重新抓取以获取任何更新?
这种问题经常被解决的方式似乎涉及用中央索引“注册”网站,然后中央索引构建基础设施以定期访问每个注册的网站。但我想知道它是否可以更聪明地完成 - 并且无需正式“注册”。
例如,大概你可以将元数据标准的一部分作为一个独特的字符串,然后你可以从字面上谷歌搜索。然后你将处理页面的其余部分。但是,有更简洁,更智能,更正式的方式吗?