如何将IP转换为向量值

时间:2019-06-06 08:46:07

标签: python pandas numpy scikit-learn tf-idf

我有一个数据集

在机器学习中,我们使用Tf-Idf根据文本数据制作矢量

但是我无法在Tf-idf中传递该值

这是数据

   remote_ip            datetime1              user_name
   192.168.1.19     2020-01-01 11:00:03          RON
   192.168.1.14     2020-01-01 11:00:04          JOHN
   192.168.1.195    2020-01-01 11:00:05          SAM
   192.168.1.120    2020-01-01 11:00:06          PILL
   192.168.1.119    2020-01-01 11:00:07          ARR
   192.168.1.119    2020-01-01 11:00:08          ARR

这是我想做的事情

我手动设置了所有这些值(向量类型值)(这样您就可以理解我想要的了)

 remote_ip    datetime1         user_name
-0.7843         -0.1231          -0.5232
 0.2313         -0.4232          -0.5833
 0.3451         -0.1243          -0.5239
-0.5618         -0.1234          -0.6735
-0.2134         -0.1235          -0.5236
-0.2134         -0.5236          -0.5238

第一次询问错误,因此请忽略错误(也许存在某些格式错误,并且全部)

将不胜感激

谢谢

1 个答案:

答案 0 :(得分:0)

  • 您应将日期转换为涉及(年,月,日,小时,分钟,秒,秒)的列
  • 用户名的标签编码
  • 将IP转换为4列。

并且在这种情况下您无需使用tf-idf,因为所有值都是数字,并且对建模有效