我有一个带有单词和他们的tf-idf分数的csv文件。我正在编写一个方法来规范化值(使它们在0和1之间)。我正在使用Pandas
蟒蛇图书馆。数据被读作Pandas的dataframe
对象。当我尝试运行代码时,我得到一个异常 - " ValueError:太多的布尔索引"。你能告诉我出了什么问题吗?我在多个论坛上经历了几个答案,但与我所面临的问题无关。
这是我收到错误的行:dtm_norm=(dtm-min)/(diffMaxMin)
这是数据格式 -
index 0
0 abbaiah 0.121030858
1 abbaiah_reddi 0.121030858
2 abbaiah_reddi_kaggadasapura 0.121030858
这是代码:
def normalizeValues(inputpath):
outputpath=inputpath+'normalized\\'
allFiles = glob.glob(inputpath+"\\*.csv")
for file in allFiles:
fileName=file.split('\\')[-1:][0]
dtm=pd.read_csv(file)
min=dtm.min(numeric_only='true')
max=dtm.max(numeric_only='true')
diffMaxMin=max-min
dtm_norm=(dtm-min)/(diffMaxMin)
writeToCsv(dtm_norm,outputpath+fileName)