Question

我有一个.csv文件，其中包含数千个数据点，格式为：

Timestamp                  Variable
2016-01-01 00:00:00+00:00  3.6

我想导入数据并创建一个2D数组，其中第一列为时间戳，第二列为变量值。最有效的方法是什么？

Answer 1

我想pandas是管理数据类型所需的库。

import pandas as pd
df = pd.read_csv('somefile.csv') 

res = df.values

您需要查看pandas上的文档（https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html）来完成read_csv并提供正确的参数

Answer 2

为了社区的利益，这是使用熊猫库解决我的问题的说明。在我的文件中，有X和Y元数据行分别在感兴趣的数据之前和之后跳过；您的里程可能会有所不同。

import pandas as pds
Y_raw= pds.read_csv('mydata.csv',
                  delimiter=',', header = None, engine = 'python',
                  skiprows = X, skipfooter = Y,
                  usecols = [0,1], names = ["TimeStamp", "Var"],  
                  parse_dates = [0], infer_datetime_format = True) ]

然后我可以使用以下方法提取Var和TimeStamp数组：

Y = Y_raw.iloc[:,1]
Z = y_raw.iloc[:,0]

Python：如何处理带有日期的.CSV？

2 个答案: