设置GitHub镜像存储库而不重复搜索结果

时间:2016-08-18 13:55:56

标签: git github repository google-search phabricator

当我search a file from my repository时,我得到一个随机镜像作为第一个结果,而the official locationold URL 301s)甚至the official GitHub mirror没有出现在搜索结果中。

我知道GitHub used to help with mirroring但我不确定他们是否仍然这样做。我们的存储库浏览器或镜像是否有问题?

官方GitHub镜像不是have a "master" branch而另一面镜像rename master是否重要?我们可以对"Syndicate carefully"做更多的事情吗?我们的GitHub镜像链接回官方镜像,但仅间接且仅来自main repository page

2 个答案:

答案 0 :(得分:1)

我尊重地认为这是一个期望问题。您说您想“认真联合”,但是开源软件基本上是相反的-允许任何人在不受您控制的任何地方联合您的代码,仅受OSS许可条款的限制。

当您在Google上搜索内容时,他们会返回他们认为与您的查询最权威,最相关的结果,不一定是其原始来源。 Google还不够聪明,还无法确定一条信息的“正式”或“原始”来源是什么,而没有使用很多有根据的猜测(初见日期,反向链接,网站授权),有时会导致错误的答案。

即使Google知道哪个存储库/网页是该信息的“官方”来源,也可能有理由链接到该算法认为更“可用”或“新鲜”的替代来源(例如,最近与废弃的回购,反向链接较少的回购,只读存档,不太受欢迎的回购托管站点上的回购等相比,更新的回购。)

如果这是专有代码,则解决方案将是DMCA在源头或与Google一起删除您代码的非官方副本。但是由于此代码的许可证可能允许自由复制,因此您无法控制联合组织,而Google认为最有用的结果可能不是官方来源

我们是否使用存储库浏览器或镜像做错了事?

没有理由相信afaik。这个排名问题是进入SEO陌生世界的经典尝试。

我的建议是,不要太担心项目中随机文件的搜索将您带到何处。您的GitHub镜像已经是“ wikimedia puppet”的最佳搜索结果,这是我希望大多数用户如果需要查看您存储库中任何文件的最新版本时都应该首先搜索的内容。

答案 1 :(得分:0)

这是搜索引擎优化的问题。

您在随机文件搜索之前获取存储库的随机副本的原因是因为它具有比主存储库更好的指标。您需要获得更多反向链接/可见性,不仅是主存储库页面,还有单个文件。

在搜索operations-puppet时,我确实得到了wikimedia github存储库。您设置的单独网站(mediawiki.org)需要更多反向链接和其他排名指标才能提高其可见度。 Github只是一个更具权威性的网站。

如果Github不能协助canonical linking,那么您必须通过其他方法收集反向链接和注意力。