在MATLAB中使用朴素贝叶斯分类器进行Internet流量分类

时间:2014-09-27 11:11:48

标签: machine-learning pcap

我正在进行有关互联网流量分类的机器学习课程。我已经从http://wand.net.nz/wits/下载了跟踪文件(以pcap格式)。现在,我想对同一数据集进行监督分类,并将流量分类为FTP,邮件,HTTP等。

我想在Matlab中进行所有这些流量分类,并使用Naive Bayes分类器。现在,我陷入困境 - 我应该如何在Matlab中处理这个pcap文件并在训练阶段获取类变量(如FTP,Mail,HTTP)。

面临的问题:

  1. 无法将此pcap文件转换为CSV等人类可读格式。
  2. 我在Wireshark中打开pcap文件,我能够识别跟踪,但是我应该如何将其保存为一种格式,以便Matlab可以处理它。
  3. 非常感谢任何帮助。

1 个答案:

答案 0 :(得分:1)

您似乎需要将数据预处理为模型可以更好地处理的格式。

我在调用Pcap.Net之前使用过C#库。这可以让您读取离线PCAP文件,然后获取和处理Matlab模型所需的数据。

可以找到用于阅读脱机PCAP文件的教程here。从那里,您可以获取所需数据包的片段,并根据您正在设计的模型对其进行格式化。

希望这有帮助!