在制表符分隔文件中将一个“列”除以另一个“列”

时间:2017-08-31 10:55:06

标签: python csv notepad++ tab-delimited

我有许多文件,其中三百万行以相同的制表符分隔格式。我需要做的就是将第14个“列”中的数字除以第12个“列”中的数字,然后将第14列中的数字设置为结果。

虽然这是一个非常简单的功能,但我实际上正在努力解决如何实现这一目标。我花了几个小时搜索这个网站,但不幸的是,我看到的答案完全超出了我的头脑,因为我是一个新手编码器!

我有Notepad ++和Ultraedit的工具(它有能力使用Javascript,虽然我对此不熟悉)和Python 3.6(我有非常基本的Python知识)。其他答案建议使用名为“awk”的东西,但是当我查看它时需要Unix - 我只有Windows。完成这项工作的最佳工具是什么?我非常愿意学习新东西。

1 个答案:

答案 0 :(得分:1)

在python中有几种方法可以处理csv。对于您的特定用例 我认为pandas正是您所寻找的。

您可以使用df = pandas.read_csv()加载文件,然后执行分割,替换就像df[13] /= df[11]一样简单。

最后,您可以使用df.to_csv()以csv格式编写数据。

我留给你填写大熊猫功能缺失的细节,但我保证这很容易,你可能会长期学习它。

希望这有帮助