我最近开始在Python和pyspark中工作。请不要介意问题是否la脚。
Df是我的datframe,它是使用pandas从CSV文件转换而成的,该CSV文件具有Real_XYZ_PQ_N0命名变量。
当我使用以下代码行时:
df = pandas.read_csv(csv_filename)
serial_id= df['sid'].unique()
for sid in serial_id:
macros = macro_file[macro_file['sid'] == sid]
df['Real_XYZ_PQ'] =(((df['Real_XYZ']/df.Real_XYZ.shift(3))**4)-1)*100
我收到以下错误:-
KeyError:'Real_XYZ'
我的csv文件中有此变量,当我使用df.columns时,我在结果集中也得到了Real_XYZ_PQ。虽然当我使用df.head(5)时我看不到Real_XYZ_PQ列。有人可以让我知道可能是什么原因。有人能告诉我这里的移位函数对结果集有什么作用吗?
我正在jupyter笔记本中运行代码。