GitHub Pages和Jekyll内容重复和SEO问题

时间:2016-01-24 17:38:49

标签: github seo jekyll canonical-link

我正在寻找使用GitHub Pages来托管我的博客和Jekyll来展示它。

据推测,无论我提出什么,都会在<yourname>.github.io通过Jekyll和https://github.com/<yourname>/<yourname>.github.io以粗体形式出现。请参阅此page showing links to live sites and to the source repos used to construct them

对SEO的建议表明,在域内和域之间复制内容是糟糕的SEO实践。请参阅此Google support page on duplication和此Moz page on issues with duplication,这两者也提供了可能的解决方案。

我的问题是双重的:

  • 内容复制实际上是GitHub Pages在实践中的问题吗?
  • 如果是这样,如何将规范链接或noindex等解决方案应用于GitHub仓库,以便搜索引擎知道您的Jekyll网站是规范网站?

更新

可能值得注意的是,我将“hello world”索引文件上传到我的GitHub Pages repo,然后在GitHub上检查了该页面的源代码。 GitHub源已包含规范链接

<link rel="canonical" href="https://github.com/guypursey/guypursey.github.io/blob/master/index.html" data-pjax-transient>

我认为这是需要更改每个文件以指向网站的Jekyll版本但我无法在GitHub中看到设置来处理它。

1 个答案:

答案 0 :(得分:4)

如果存储库是公共的,那么在向用户和组织使用GitHub页面时,重复的内容是不可避免的

一般来说,这不应成为问题。请参阅previous answer

你有几个选择:

  • 谷歌和其他搜索引擎显然无法访问需要付费计划的私人存储库。
  • 切换到project page。这将使用gh-pages分支而不是master分支。由于GitHub的robots.txt只允许搜索引擎抓取主分支并禁止其他分支。因此,如果该网站位于gh-pages分支,则会阻止Google查看该存储库。