python

时间:2018-05-18 11:50:17

标签: python excel dataset data-cleaning

我正在研究机器学习项目。所涉及的数据集有一个名为'TimeStamp'的功能,格式如下Month12 Day9 10:20:00。 有超过10万的此类条目。我想以下列格式更改所有这些格式2013-07-04 00:00:00

如何在excel或python中执行此操作?

2 个答案:

答案 0 :(得分:0)

Python的datetime模块包含您需要的部分。具体来说,您可以使用strptime()将字符串解析为datetime对象,使用strftime()datetime对象格式化为字符串。

文档:https://docs.python.org/3.6/library/datetime.html#strftime-strptime-behavior

你还没有说过你的数据是如何存储的,但是如果它存在于例如的CSV文件中,你可能很幸运将它加载到pandas数据帧中;大熊猫在将字符串解释为日期/时间方面相当聪明,没有太多的帮助。

答案 1 :(得分:0)

您可以使用re模块:

import re

regex = r"Month(?P<month>\d{2}) Day(?P<day>\d{1,2}) (?P<time>\d{2}:\d{2}:\d{2})"
result = r"2012-\g<month>-0\g<day> \g<time>" # Assuming the year is 2012

print(re.sub(regex, result, "Month12 Day9 10:20:00"))

这将打印:

2012-12-09 10:20:00