我正在研究机器学习项目。所涉及的数据集有一个名为'TimeStamp'的功能,格式如下Month12 Day9 10:20:00
。
有超过10万的此类条目。我想以下列格式更改所有这些格式2013-07-04 00:00:00
。
如何在excel或python中执行此操作?
答案 0 :(得分:0)
Python的datetime
模块包含您需要的部分。具体来说,您可以使用strptime()
将字符串解析为datetime
对象,使用strftime()
将datetime
对象格式化为字符串。
文档:https://docs.python.org/3.6/library/datetime.html#strftime-strptime-behavior
你还没有说过你的数据是如何存储的,但是如果它存在于例如的CSV文件中,你可能很幸运将它加载到pandas数据帧中;大熊猫在将字符串解释为日期/时间方面相当聪明,没有太多的帮助。
答案 1 :(得分:0)
您可以使用re
模块:
import re
regex = r"Month(?P<month>\d{2}) Day(?P<day>\d{1,2}) (?P<time>\d{2}:\d{2}:\d{2})"
result = r"2012-\g<month>-0\g<day> \g<time>" # Assuming the year is 2012
print(re.sub(regex, result, "Month12 Day9 10:20:00"))
这将打印:
2012-12-09 10:20:00