我在.csv
中有一堆数据,如下所示:
-959.378170,-0.000026,-94.960000,1508.000000,9.000000,
-958.978170,-0.000026,-94.920000,1508.000000,9.000000,
-958.578170,-0.000026,-94.880000,1508.000000,10.000000,
-958.178170,-0.000026,-94.840000,1508.000000,10.000000,
-957.778170,-0.000026,-94.800000,1508.000000,10.000000,
最后两列应该是时间。 15
是小时,08
是分钟,6
是秒。最终目标是加入他们,以便得到类似的东西:
-958.978170,-0.000026,-94.920000,15:08:09,
-958.578170,-0.000026,-94.880000,15:08:10,
我该怎么做?
答案 0 :(得分:1)
使用csv
模块阅读.csv
文件(有关示例,请参阅here),并使用datetime.strptime
方法将两列解析为datetime
对象,然后您可以写出您想要的任何格式(使用datetime.strftime
)。
有关详细信息,请参阅datetime
文档的this部分。
答案 1 :(得分:1)
import fileinput
import re
# Assume the input file is foo.csv
for line in fileinput.FileInput('foo.csv', inplace=1):
mm = re.search(r'^(.+?,.+?,.+?,)(\d{1,2})(\d{2})\.0+,(\d{1,2})\.0+',
line)
g1, g2, g3, g4 = mm.group(1), int(mm.group(2)), int(mm.group(3)), int(mm.group(4))
print "%s%02i:%02i:%02i," % (g1, g2, g3, g4)
在示例上运行此结果导致...
-959.378170,-0.000026,-94.960000,15:08:09,
-958.978170,-0.000026,-94.920000,15:08:09,
-958.578170,-0.000026,-94.880000,15:08:10,
-958.178170,-0.000026,-94.840000,15:08:10,
-957.778170,-0.000026,-94.800000,15:08:10,
答案 2 :(得分:1)
查看pandas中的read_csv()方法(http://pandas.pydata.org/pandas-docs/stable/io.html#csv-text-files)。
它有一个很棒的日期解析实用程序,允许您将多个列中的字符串组合在一起。