我目前正在从特定域抓取大量流量来抓取我的网站,因为他们没有通过IP地址,因此我们遇到阻止使用htaccess的问题。
因此我想在GA中创建一个配置文件过滤器以阻止流量,但我有点困惑。
在GA的报告套件中,我想要的域只能在网络域维度中找到,但是在配置文件级过滤器中这不是一个选项,是否有人知道要使用的最佳过滤器
ISP组织或ISP域,据我所知,这似乎是一个无证件
干杯
约翰
答案 0 :(得分:1)
ISP域工作只需要知道要过滤的域名。
您还可以设置自定义过滤器,而不使用可以过滤掉主机名的预定义过滤器。
答案 1 :(得分:1)
Google Analytics
当您处于“管理”标签中时,过滤Google Analytics中的流量不会追溯使用Web过滤器。因此,任何已经发生的流量都不会从当前结果集中过滤掉。话虽如此,为了提高效率,您可以create a Custom Report根据一些事情不显示来自机器人的任何流量。您可以将其排除在以下特定浏览器版本之外:
exclude > Browser Version > Exact > BadBot
您还可以对IP范围使用自定义过滤器,甚至可以过滤掉来自特定国家/地区的流量,或限制流量到您自己的国家/地区(如果您的网站所针对的是该目标)。
在[网络]服务器上停止
关于保护Web服务器,适用相同的规则(例如,如果流量是来自badexample.com
的所有引荐流量)。
RewriteCond %{HTTP_REFERER} ^badexample.com [NC]
RewriteRule .* - [F]
你可以block by IP ranges and reverse domain look-ups in Apache using Deny directives。
Deny from 192.168.205
Deny from badexample.com
Deny from de
你可以block them using Environment Variables:
SetEnvIf User-Agent BadBot GoAway=1
Order allow,deny
Allow from all
Deny from env=GoAway
答案 2 :(得分:0)
如果它是一个机器人刮你的网站,你确定他们甚至在执行JavaScript吗?
所有请求都应该传递IP地址,尽管它可以是代理而不是实际来源。