熊猫索引越界错误

时间:2018-06-01 06:20:33

标签: python pandas numpy

我已经编写了一些代码作为Coursera(数据分析)课程的一部分,发生了索引越界错误。我似乎找不到原因。 Census.csv的链接:https://github.com/words-sdsc/coursera/blob/master/big-data-2/csv/census.csv

代码:

import pandas as pd
import numpy as np
df = pd.read_csv('census.csv')
print(df.head())
(df.where(df['SUMLEV']==50).dropna()
    .set_index(['STNAME','CTYNAME'])
    .rename(columns={'ESTIMATESBASE2010': 'Estimates Base 2010'}))
df = df[df['SUMLEV']==50]
df.set_index(['STNAME','CTYNAME'], inplace=True)
df.rename(columns={'ESTIMATESBASE2010': 'Estimates Base 2010'})
print(df.head())
def min_max(row):
   data = df.loc['Alabama','Clarke County'][row]
    return data
print(df.apply(min_max,axis=0))

输出: enter image description here

除此之外,还会出现错误。

  

Traceback(最近一次调用最后一次):文件   " C:\用户\ siddh \应用程序数据\本地\程序\的Python \ Python36-32 \ lib中\站点包\大熊猫\芯\ series.py&#34 ;,   第876行,在_get_values中       return self._constructor(self._data.get_slice(indexer),File" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ pandas \ core \ internals。 PY&#34 ;,   第4706行,在get_slice中       return self。 class (self._block._slice(slobj),File" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \大熊猫\芯\ internals.py&#34 ;,   第312行,在_slice中       return self.values [slicer] IndexError:索引99超出了轴0的大小为98

     

在处理上述异常期间,发生了另一个异常:

     

回溯(最近一次呼叫最后):文件" C:/ prithvi / ML /数据   科学/数据导入 - 科学 - 在-python-master / census.py",行   16,在       print(df.apply(min_max,axis = 0))File" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ pandas \ core \ frame.py& #34 ;,   第6004行,申请中       return op.get_result()File" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ pandas \ core \ apply.py",   第318行,在get_result中       return super(FrameRowApply,self).get_result()File" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ pandas \ core \ apply.py&#34 ;,   第142行,在get_result中       return self.apply_standard()File" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ pandas \ core \ apply.py",   第248行,在apply_standard中       self.apply_series_generator()文件" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ pandas \ core \ apply.py",   第277行,在apply_series_generator中       results [i] = self.f(v)File" C:/ prithvi / ML / Data Science / Introduction to to-Data-Science-in-python-master / census.py",line   14,在min_max       data = df.loc [' Alabama',' Clarke County'] [row]文件" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36- 32 \ lib中\站点包\大熊猫\芯\ series.py&#34 ;,   第809行, getitem       return self._get_with(key)File" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ pandas \ core \ series.py",   第843行,在_get_with中       return self._get_values(key)File" C:\ Users \ siddh \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ pandas \ core \ series.py",   第879行,在_get_values中       return self._values [indexer] IndexError :('索引99超出轴0的范围,大小为98','出现在索引COUNTY')

怀疑:如何修复此索引超出绑定错误?我曾尝试在Google上搜索类似的错误,但没有出现。

0 个答案:

没有答案