我有一个csv文件,我使用pd.read_csv()导入。原始数据中有59列,我只需要13列。 loc返回行数据的NaN值。请参阅以下代码:
file = 'es.txt'
data = pd.read_csv(file)
print(data.head())
Date Time Open High Low Last Volume # of Trades \
0 2018/3/7 16:15:00.0 61.25 61.26 61.23 61.24 22 18
1 2018/3/7 16:20:00.0 61.23 61.24 61.14 61.17 58 42
2 2018/3/7 16:25:00.0 61.17 61.20 61.17 61.19 68 63
3 2018/3/7 16:30:00.0 61.20 61.20 61.19 61.20 12 8
4 2018/3/7 16:35:00.0 61.20 61.24 61.20 61.24 11 11
OHLC Avg HLC Avg ... 200Line -100Line -200Line Main Slope \
0 61.24 61.24 ... 200.0 -100.0 -200.0 -nan(ind)
1 61.19 61.18 ... 200.0 -100.0 -200.0 -nan(ind)
2 61.18 61.19 ... 200.0 -100.0 -200.0 253.379
3 61.20 61.20 ... 200.0 -100.0 -200.0 146.660
4 61.22 61.23 ... 200.0 -100.0 -200.0 229.741
Turbo Slope Diff 150Line -150Line 50Line -50Line
0 -nan(ind) nan 150.0 -150.0 50.0 -50.0
1 -nan(ind) 266.684 150.0 -150.0 50.0 -50.0
2 108.591 121.896 150.0 -150.0 50.0 -50.0
3 62.854 38.090 150.0 -150.0 50.0 -50.0
4 98.461 93.191 150.0 -150.0 50.0 -50.0
[5 rows x 59 columns]
# only get the 13 columns I need, and 5 rows
columns = ['Date', 'Time', 'Open', 'High', 'Low', 'Last',
'Volume', '# of Trades', 'CCI Main', 'CCI Turbo',
'MainSlope', 'TurboSlope', 'Diff']
df = data.loc[1:5, columns]
print(df)
Date Time Open High Low Last Volume # of Trades CCI Main \
1 2018/3/7 NaN NaN NaN NaN NaN NaN NaN NaN
2 2018/3/7 NaN NaN NaN NaN NaN NaN NaN NaN
3 2018/3/7 NaN NaN NaN NaN NaN NaN NaN NaN
4 2018/3/7 NaN NaN NaN NaN NaN NaN NaN NaN
5 2018/3/7 NaN NaN NaN NaN NaN NaN NaN NaN
CCI Turbo MainSlope TurboSlope Diff
1 NaN NaN NaN NaN
2 NaN NaN NaN NaN
3 NaN NaN NaN NaN
4 NaN NaN NaN NaN
5 NaN NaN NaN NaN
这是返回NaN值。我在这里缺少什么?