标签: pyspark
我正在与pyspark合作开展机器学习项目。作为一个初学者,我困惑的一件事是其中一个输入数据是一个IP地址。我的问题是如何使用IP地址作为训练模型的功能?谢谢!
答案 0 :(得分:-1)
您可以对IPv4执行以下操作: -一种热门编码 -IP地址的第一个Uni,Bi和Trigram -IP地址的整数值之间的差异 -地理位置 -欧氏距离 -汉明距离 -群集
以下是有关每种方法的更多详细信息的图像: Ip address feature extraction