我目前正在使用colaboratory,熊猫和keras来用神经网络弄湿我的脚趾。要设置数据,我需要对所有数据进行规范化(为此,我将除以最大值得到0到1之间的所有值)。但是,我遇到了两个问题。
由于某些原因,“ stroke_count”列未被修改,或者无论如何它都被舍入为0。
我看到了 df.fillna(7) 据说用括号内的值替换了所有Null或NaN值,但它没有这样做。
# generating character dictionary & normalizing data
hanzi_dict = {}
hanzi_counter = 0
df.fillna(7)
for index, row in df.iterrows():
hanzi_dict[str(hanzi_counter)] = row['charcter']
hanzi_counter = hanzi_counter + 1
df.at[index, 'radical_code'] = row['radical_code'] / 214.9 # max value of any radical
df.at[index, 'stroke_count'] = row['stroke_count'] / 35.0 # max # of strokes
df.at[index, 'hsk_levl'] = row['hsk_levl'] / 7 # max level + 1
print(hanzi_dict)
display(df)