如何切片通过数据库查询的数据的日期?

时间:2018-08-17 03:44:27

标签: python python-2.7 pandas influxdb-python

如何使用std输入函数对数据进行切片?

我的数据如下:

                 time                duration
0 2018-07-04 12:19:29+00:00         4000000000
1 2018-07-04 12:20:30+00:00         4000000000
2 2018-07-04 12:21:31+00:00         3700000000
3 2018-07-04 12:22:31+00:00         4100000000
4 2018-07-04 12:23:31+00:00         4100000000

我从influxdb查询数据,然后将其转换为Dataframe。 输入SyntaxError: invalid token

时出现错误Starting date :

我试图将time列拆分为单独的dateTime

import influxdb
import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt

client = influxdb.DataFrameClient('192.168.1.108' , port = 8086, database = 'Mlogi_01081081')

dfs_dict = client.query('select * from sy_1')

measurement = next(iter(dfs_dict))

ret = dfs_dict[measurement]

df = pd.DataFrame.from_dict(ret)

df = df.reset_index()

df.rename( columns={'index':'time'}, inplace=True )

df['time'] = pd.to_datetime(df['time'])

df['Time'] = df['time'].dt.time

df['date'] = df['time'].dt.date
df['date'] = pd.to_datetime(df['date'])

df = df.set_index(['date'])

a = input('Starting_Date: ')
b = input('Ending_Date :')

starting_date = datetime.strptime(a, "%Y-%m-%d").date()
ending_date = datetime.strptime(b, "%Y-%m-%d").date()

df.loc[starting_date:ending_date]

仍然没有运气!!!

1 个答案:

答案 0 :(得分:1)

从您的问题开始,这应该是您的工作,我假设您想使用date作为指定列来执行两次过滤,以获取两次之间的所有数据。根据OP的要求,由于他使用的是Python 2.7,因此键入的输入应使用“”这样的引号,以使用户的输入正常工作。

>>> input("please type the date: ") 
please type the date: 2016-08-09
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<string>", line 1
    2016-08-09
          ^
SyntaxError: invalid token
>>> input("please type the date: ") 
please type the date: "2018-07-09" 
'2018-07-09'

由于存在过滤数据的实际问题,您可以执行以下操作:

newdf = df[(df["date"]>starting_date) and df["date"]<=ending_date] 

这应该给您预期的结果。但是您必须确保df["date"]starting_dateending_date具有相同的数据类型。