使用Python修改csv中的特定列

时间:2012-07-31 22:51:55

标签: python csv

我在.csv中有一堆数据,如下所示:

-959.378170,-0.000026,-94.960000,1508.000000,9.000000,
-958.978170,-0.000026,-94.920000,1508.000000,9.000000,
-958.578170,-0.000026,-94.880000,1508.000000,10.000000,
-958.178170,-0.000026,-94.840000,1508.000000,10.000000,
-957.778170,-0.000026,-94.800000,1508.000000,10.000000,

最后两列应该是时间。 15是小时,08是分钟,6是秒。最终目标是加入他们,以便得到类似的东西:

-958.978170,-0.000026,-94.920000,15:08:09,                
-958.578170,-0.000026,-94.880000,15:08:10,

我该怎么做?

3 个答案:

答案 0 :(得分:1)

使用csv模块阅读.csv文件(有关示例,请参阅here),并使用datetime.strptime方法将两列解析为datetime对象,然后您可以写出您想要的任何格式(使用datetime.strftime)。

有关详细信息,请参阅datetime文档的this部分。

答案 1 :(得分:1)

我会使用regexfileinput

import fileinput
import re

# Assume the input file is foo.csv
for line in fileinput.FileInput('foo.csv', inplace=1):
    mm = re.search(r'^(.+?,.+?,.+?,)(\d{1,2})(\d{2})\.0+,(\d{1,2})\.0+',
        line)
    g1, g2, g3, g4 = mm.group(1), int(mm.group(2)), int(mm.group(3)), int(mm.group(4))
    print "%s%02i:%02i:%02i," % (g1, g2, g3, g4)

在示例上运行此结果导致...

-959.378170,-0.000026,-94.960000,15:08:09,
-958.978170,-0.000026,-94.920000,15:08:09,
-958.578170,-0.000026,-94.880000,15:08:10,
-958.178170,-0.000026,-94.840000,15:08:10,
-957.778170,-0.000026,-94.800000,15:08:10,

答案 2 :(得分:1)

查看pandas中的read_csv()方法(http://pandas.pydata.org/pandas-docs/stable/io.html#csv-text-files)。

它有一个很棒的日期解析实用程序,允许您将多个列中的字符串组合在一起。