我的网站受到伪装成SEO解决方案的点击诱饵机器人的攻击。</ p>
那些机器人每天都在弄乱我的数字...
每当我发现一个假冒的引荐网址试图诱骗我时,我都会通过其广告系列来源(通常包含“ SEO”一词)对其进行过滤/阻止。
过滤器适用于显式源,但是那些漫游器每次都用新的URL广告系列源来打击我。因此,我最终不得不尝试使用数十个过滤器来阻止所有这些过滤器!
以下是一些示例:
autoseo-b2b-seo-service.com
seo-services-wordpress.com
krumbleead-ads.info
seo-services-b2b.com
growth-hackingead.info
autoseo-b2b-services.com
seo-b2b-analytics.com
seo-b2b.com
seo-for-b2b.com
我正在寻找RegEx过滤器解决方案,以阻止任何包含带有短划线的“ seo-” SEO单词的引荐来源网址。
我不精通RegEx ...但是我只是添加(排除)并尝试以下操作:
.*seo-.*$
Q1。这看起来正确吗? Q2。阻止所有这些F ****机器人的更好解决方案? Q3。你今天喝了几杯咖啡? :P
答案 0 :(得分:0)
对正则表达式有点生疏。我上次检查时是Buuut:
Q1:这看起来正确吗?
如果要检查它是否为单个完整词,则为$ csvanalysis.db
SQLite version 3.19.3 2017-06-27 16:48:08
Enter ".help" for usage hints.
sqlite> CREATE TABLE csvdata (A, B, ID, C, D);
sqlite> CREATE INDEX csvdata_id on csvdata (ID);
sqlite> .import /path/to/file.csv csvdata
sqlite> SELECT ID, COUNT(*) FROM csvdata GROUP BY ID;
\ b代表“单词边界”
所以\bTest\b
我相信=)
第二季度:更好的解决方案来阻止所有这些 expetive 机器人?
我认为您可以真正拥有最佳解决方案。
Q3:您今天喝了几杯咖啡?
我喝茶。薄荷茶正常。但是我整天都很忙,所以我只有一个!主要是通过这大瓶水
进一步阅读:https://www.regular-expressions.info/completelines.html