使用自定义字体欺骗刮刀的网页字体

时间:2017-12-22 15:22:39

标签: css python-3.x fonts web-scraping artificial-intelligence

我试图删除信息的网站决定使用自定义字体,这意味着代码中的所有信息都是混乱的字母。例如:“aEfrg9”在使用字体时可能看起来像“Booked”。我怎么能刮掉这样的网页?

我的想法:

  1. 从页面下载字体
  2. 以某种方式将我正在寻找的信息翻译成代码消息字体,例如。我想在网页上找到“吉他”,所以我的程序使用下载的字体文件将其翻译成“hGke8j”。
  3. 我如何实现第2步?

    我正在使用Python 3.X

0 个答案:

没有答案