我想将数据帧以训练数据的VW格式放置,如下所示:
array(['-1 | feature1:aaa feature2:bbbb',
'-1 | feature1:abc feature2:fhfhf'])
如何通过简单的熊猫数据框实现这一目标?
我首先将数据集的行转换为行:
rows = data.to_dict('records')
然后创建一个空数组,以放置值:
train_data = np.array([], dtype=object)
然后通过一些循环,我可以达到预期的结果,尽管在大型数据帧上运行它需要花费很多时间。有什么快速的解决方案吗?