我有许多文件,其中三百万行以相同的制表符分隔格式。我需要做的就是将第14个“列”中的数字除以第12个“列”中的数字,然后将第14列中的数字设置为结果。
虽然这是一个非常简单的功能,但我实际上正在努力解决如何实现这一目标。我花了几个小时搜索这个网站,但不幸的是,我看到的答案完全超出了我的头脑,因为我是一个新手编码器!
我有Notepad ++和Ultraedit的工具(它有能力使用Javascript,虽然我对此不熟悉)和Python 3.6(我有非常基本的Python知识)。其他答案建议使用名为“awk”的东西,但是当我查看它时需要Unix - 我只有Windows。完成这项工作的最佳工具是什么?我非常愿意学习新东西。
答案 0 :(得分:1)
在python中有几种方法可以处理csv。对于您的特定用例
我认为pandas
正是您所寻找的。 p>
您可以使用df = pandas.read_csv()
加载文件,然后执行分割,替换就像df[13] /= df[11]
一样简单。
最后,您可以使用df.to_csv()
以csv格式编写数据。
我留给你填写大熊猫功能缺失的细节,但我保证这很容易,你可能会长期学习它。
希望这有帮助