使用机器学习检测恶意网页

时间:2018-06-24 15:37:28

标签: security web deep-learning malware-detection

我正在寻找一个可检测恶意网页的应用程序。我在考虑浏览器扩展。因此,我开始寻找一些研究论文,并找到了下面的论文。

A Deep Learning Approach to detecting Malicious Javascript code - Wang et. al

尽管这看起来已经足够好了,但是我找不到源代码的链接。如何获得研究论文的源代码?

还有其他可以使用的有希望的带有源代码的论文吗?

1 个答案:

答案 0 :(得分:1)

本文是关于如何训练模型的,这是机器学习系统的核心。 “源代码”通常是像TensorFlow这样的标准引擎。您需要的是大量带有标签的恶意javascript和非恶意javascript的示例。您正在描述的项目是基于该语料库的收集,标记和构建模型。可执行源代码只是次要的细节,至少每个人都可以使用TensorFlow,因为每个人都使用TensorFlow。 (“使用TensorFlow来构建ML系统”等同于“使用C来构建操作系统。”这并不是要描述如何实际构建事物;构建该事物是一项主要工作。)

您链接的论文中的主要人工产物是“超过27 000个带有标签的样本”。我认为他们没有向公众发布该语料库(更不用说训练有素的模型了)。本文描述了如何根据自己的样本构建自己的模型。

如果您对这种事情感兴趣,请从TensorFlow教程开始。了解如何对花朵进行分类(因为这就是每个人都从这里开始的)。然后学习如何对计算机语言进行分类(Java,Swift和Haskell)。有了这些经验,我相信本文对您会更有意义。 (它仍然相当先进,但至少您会知道问题的样子。)