security - 使用机器学习检测恶意网页

本文是关于如何训练模型的，这是机器学习系统的核心。 “源代码”通常是像TensorFlow这样的标准引擎。您需要的是大量带有标签的恶意javascript和非恶意javascript的示例。您正在描述的项目是基于该语料库的收集，标记和构建模型。可执行源代码只是次要的细节，至少每个人都可以使用TensorFlow，因为每个人都使用TensorFlow。（“使用TensorFlow来构建ML系统”等同于“使用C来构建操作系统。”这并不是要描述如何实际构建事物；构建该事物是一项主要工作。）

您链接的论文中的主要人工产物是“超过27 000个带有标签的样本”。我认为他们没有向公众发布该语料库（更不用说训练有素的模型了）。本文描述了如何根据自己的样本构建自己的模型。

如果您对这种事情感兴趣，请从TensorFlow教程开始。了解如何对花朵进行分类（因为这就是每个人都从这里开始的）。然后学习如何对计算机语言进行分类（Java，Swift和Haskell）。有了这些经验，我相信本文对您会更有意义。（它仍然相当先进，但至少您会知道问题的样子。）

使用机器学习检测恶意网页

1 个答案: