我想将我的电子邮件包含在github存储库中的readme.md文件中。当然,我想以某种方式混淆它以避免垃圾邮件。
从this tutorial开始,我阅读了以下文字:
电子邮件地址的自动链接的工作方式与此类似 Markdown还将执行一些随机小数和十六进制 实体编码,以帮助模糊您的地址从地址收获 反垃圾邮件插件。例如,Markdown将转为:
<address@example.com>
这样的事情:
<a href="mailto:addre ss@example.co m">address@exa mple.com</a>
我做了他们所说的,但是当我检查包含自述文件的github页面的源代码时,我仍然可以看到:
<a href="address@example.com">address@example.com</a>
我错过了什么吗?在我看来,机器人应该能够找到它,如果它在网页的源代码中。
答案 0 :(得分:3)
GitHub的Markdown引擎没有此功能。
无论如何都不值得使用;它不会阻止任何现代爬虫。
答案 1 :(得分:2)
我建议在HTML和Markdown文档中创建和嵌入文本图像。虽然很快就不会出现这种情况,但大多数简单的抓取工具都没有设置为检测图像中的文本。
有一些简单的方法可以使用Image Magick在Unix命令行上批量生成文本(默认情况下通常安装在大多数服务器上)。输出完全可自定义(包括大小,字体,颜色,边框,背景等)
这是一个简单的示例,改编自commandlinefu.com上的帖子:
echo -e "email.address@host" | convert -background none -density 196 -resample 72 -unsharp 0x.5 -font "Courier" text:- -trim +repage -bordercolor white -border 0 email-address-image.gif
此示例生成一个文件(email-address-image.gif),可以嵌入内联Markdown文档,如下所示:
![email address image](http://cmscoby.com/public/pics/email-address-image.gif)
link to example email address image
此方法需要另一个生成图像的步骤(不可否认,如果您需要只能放入Markdown或HTML文档的代码段,则可能超出您的要求。)
答案 2 :(得分:0)
GitHub有这个功能!这是毫无意义的,因为链接的href中的电子邮件地址保持不变,并且如此处所提到的,它不会阻止任何正常的爬虫,但是,要利用此功能只需编写您的电子邮件,如<email@domain.com>
,它们将自动变成带有混淆文本的mailto链接。