我正在寻找使用GitHub Pages来托管我的博客和Jekyll来展示它。
据推测,无论我提出什么,都会在<yourname>.github.io
通过Jekyll和https://github.com/<yourname>/<yourname>.github.io
以粗体形式出现。请参阅此page showing links to live sites and to the source repos used to construct them。
对SEO的建议表明,在域内和域之间复制内容是糟糕的SEO实践。请参阅此Google support page on duplication和此Moz page on issues with duplication,这两者也提供了可能的解决方案。
我的问题是双重的:
noindex
等解决方案应用于GitHub仓库,以便搜索引擎知道您的Jekyll网站是规范网站?可能值得注意的是,我将“hello world”索引文件上传到我的GitHub Pages repo,然后在GitHub上检查了该页面的源代码。 GitHub源已包含规范链接
<link rel="canonical" href="https://github.com/guypursey/guypursey.github.io/blob/master/index.html" data-pjax-transient>
我认为这是需要更改每个文件以指向网站的Jekyll版本但我无法在GitHub中看到设置来处理它。
答案 0 :(得分:4)
如果存储库是公共的,那么在向用户和组织使用GitHub页面时,重复的内容是不可避免的
一般来说,这不应成为问题。请参阅previous answer。
你有几个选择:
gh-pages
分支而不是master
分支。由于GitHub的robots.txt只允许搜索引擎抓取主分支并禁止其他分支。因此,如果该网站位于gh-pages
分支,则会阻止Google查看该存储库。