文本转换 - Python中的模型训练

时间:2018-01-26 04:58:38

标签: python transformation unsupervised-learning

我有一个源数据文件(区域,产品,月份,销售额),并希望通过修改“区域”ID来转换此数据。

源数据

US, prius, 10-2017, 100000.00
US, leaf, 10-2017, 25000.00
UK, prius, 10-2017, 65000.00

目标数据

NA-US, prius, 10-2017, 100000.00    
NA-US, leaf, 10-2017, 25000.00
EU-UK, prius, 10-2017, 65000.00

我正在改变美国 - > NA-US和UK - >欧盟 - 英国

我不想维护映射表,培训模型和转换ID的方法是什么?假设源和目标中都没有新的“区域”ID。

1 个答案:

答案 0 :(得分:1)

我认为最简单的解决方案是使用正则表达式。

your_csv_data.replace("^US,", "NA-US,")
your_csv_data.replace("^UK,", "EU-UK,")

如果你只需要匹配这两种情况,那么正则表达式就足够了。