我是Python的入门者。将数据转换为日期时间格式时出现问题。在DTNAIPRS列中,我有:
0 1972-12-22
1 1936-04-01
2 1925-10-05
3 1926-07-09
4 1952-01-12
5 1964-12-31
6 1940-01-13
7 1942-09-01
8 1939-01-12
9 1954-04-14
10 0001-01-01
11 1944-04-18
12 0001-01-01
13 1932-11-16
14 1936-05-18
15 1936-07-02
16 1944-01-13
17 1954-06-20
18 1927-02-14
19 1938-04-29
20 0001-01-01
当我尝试在日期时间使用test = pd.to_datetime(T_Client.DTNAIPRS.values)
我遇到此错误:
>Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-6081451798601516313.py", line 349, in <module>
raise Exception(traceback.format_exc())
Exception: Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-6081451798601516313.py", line 342, in <module>
exec(code)
File "<stdin>", line 4, in <module>
File "/misc/anaconda2-4.4.0/envs/dev2/lib/python2.7/site-packages/pandas/core/tools/datetimes.py", line 380, in to_datetime
result = _convert_listlike(arg, box, format)
File "/misc/anaconda2-4.4.0/envs/dev2/lib/python2.7/site-packages/pandas/core/tools/datetimes.py", line 306, in _convert_listlike
raise e
OutOfBoundsDatetime: Out of bounds nanosecond timestamp: 1-01-01 00:00:00
能帮我吗? 谢谢
答案 0 :(得分:1)
由于熊猫以纳秒分辨率表示时间戳,因此可以使用64位整数表示的时间跨度限制为大约584年。
您的日期值超出范围1-01-01 00:00:00
,因此超出范围错误。
In [92]: pd.Timestamp.min
Out[92]: Timestamp('1677-09-21 00:12:43.145225')
In [93]: pd.Timestamp.max
Out[93]: Timestamp('2262-04-11 23:47:16.854775807')
答案 1 :(得分:0)
这是一步一步的
import pandas as pd
import numpy as np
d = ['1972-12-22','1936-04-01','1925-10-05','1926-07-09','1952-01-12']
df = pd.DataFrame({'dates' :d})
df['dates'] = df['dates'].astype(pd.datetime)
df['dates'].dtype
df2 = pd.to_datetime(df['dates'])
print(df2)
这是在Google Colab中尝试过的,我认为这就是您想要的
如果您还有其他问题,请告诉我。
答案 2 :(得分:0)
我正在使用此代码将str转换为时间。 首先应用您想要的格式,在我的情况下是小时/分钟/秒 您可以插入yyyy-mm-dd
然后选择需要更改的列,并将training_epochs = 10
step = 0
for epoch in range(training_epochs)
print("starting ",epoch)
for features, labels in dataset:
with tf.GradientTape() as tape:
loss = compute_loss(model(features),labels)
gradients = tape.gradients(loss, model.trainable_variables)
optimizer.apply_gradients(zip(gradients, model.trainable_variables))
step += 1
if step % 10 == 0:
# measure other metrics if needed
print("loss: ", loss)
print("Epoch ", epoch, " finished.")
更改为.dt.time
.dt.date
祝你好运
答案 3 :(得分:0)
您的问题是您的列包含(奇怪的)日期,这些日期无法用基础的pd.Timestamp
类型表示,因为它是从numpy datetime64类型派生的(有关详细信息,请参见Manoj Kumar's answer)。
一种简单的方法是在转换之前过滤掉这些值:
pd.to_datetime(T_Client.DTNAIPRS.where(T_Client.DTNAIPRS>='1677-09-22'))