Question

我有一个带有单词和他们的tf-idf分数的csv文件。我正在编写一个方法来规范化值（使它们在0和1之间）。我正在使用Pandas 蟒蛇图书馆。数据被读作Pandas的dataframe对象。当我尝试运行代码时，我得到一个异常 - ＆＃34; ValueError：太多的布尔索引＆＃34;。你能告诉我出了什么问题吗？我在多个论坛上经历了几个答案，但与我所面临的问题无关。

这是我收到错误的行：dtm_norm=(dtm-min)/(diffMaxMin)

这是数据格式 -

    index   0
0   abbaiah 0.121030858
1   abbaiah_reddi   0.121030858
2   abbaiah_reddi_kaggadasapura 0.121030858

这是代码：

def normalizeValues(inputpath):
    outputpath=inputpath+'normalized\\'

    allFiles =  glob.glob(inputpath+"\\*.csv")
    for file in allFiles:
        fileName=file.split('\\')[-1:][0]
        dtm=pd.read_csv(file)
        min=dtm.min(numeric_only='true')
        max=dtm.max(numeric_only='true')
        diffMaxMin=max-min
        dtm_norm=(dtm-min)/(diffMaxMin)
        writeToCsv(dtm_norm,outputpath+fileName)

Pandas错误：布尔索引太多

0 个答案: