我有一个.csv文件,其中包含数千个数据点,格式为:
Timestamp Variable
2016-01-01 00:00:00+00:00 3.6
我想导入数据并创建一个2D数组,其中第一列为时间戳,第二列为变量值。最有效的方法是什么?
答案 0 :(得分:1)
我想pandas
是管理数据类型所需的库。
import pandas as pd
df = pd.read_csv('somefile.csv')
res = df.values
您需要查看pandas
上的文档(https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html)来完成read_csv
并提供正确的参数
答案 1 :(得分:0)
为了社区的利益,这是使用熊猫库解决我的问题的说明。在我的文件中,有X
和Y
元数据行分别在感兴趣的数据之前和之后跳过;您的里程可能会有所不同。
import pandas as pds
Y_raw= pds.read_csv('mydata.csv',
delimiter=',', header = None, engine = 'python',
skiprows = X, skipfooter = Y,
usecols = [0,1], names = ["TimeStamp", "Var"],
parse_dates = [0], infer_datetime_format = True) ]
然后我可以使用以下方法提取Var
和TimeStamp
数组:
Y = Y_raw.iloc[:,1]
Z = y_raw.iloc[:,0]