我的代码:
import numpy as np
import pandas as pd
import time
tic = time.time()
我读了一个长文件[meter] [daycode] [以kWh为单位的读数]。时间序列超过6000米。
consum = pd.read_csv("data/File1.txt", delim_whitespace=True, encoding = "utf-8", names =['meter', 'daycode', 'val'], engine='python')
consum.set_index('meter', inplace=True)
因为我实际上总共有6个这个大小的文件,我想过滤掉那些信息不足的文件。这些是按类别在代码3下具有[米]值的时间序列数据。我可以从另一个文件中收集此类别信息。以下是我提取的地方。
id_total = pd.read_csv("data/meter_id_code.csv", header = 0, encoding="cp1252")
#print(len(id_total.index))
id_total.set_index('Code', inplace=True)
id_other = id_total.loc[3].copy()
print id_other
这是我写入csv以检查最后一行是否正确执行的地方:
id_other.to_csv('data/id_other.csv', sep='\t', encoding='utf-8')
print consum[~consum.index.isin(id_other)]
输出:(打印id_other)
如何修复最后一行?