阅读数据集文件时出现解析器错误

时间:2019-09-06 10:07:12

标签: python pandas csv reader

新鲜到python。 我正在从数据集中复制images.txt和eval.txt文件,但遇到与解析数据有关的错误,例如读取csv文件。

已使用PD.read_csv(file , sep ='\s')

具有不同的分隔,但没有得到实际答案仍会出错

#主代码

def Eval(head=True):
    path = os.path.join(os.getcwd(), 'watchout/data/raw_deepfashion_dataset/Eval/list_eval_partition.txt')
    data = pd.read_csv(path, sep=r"\s*",delimiter=':   ', skiprows=[0], header=0)
    if head:
        return data.head(100)
    return data


def Anno(is_train=True, head=False):
    # Anno(os.path.join(os.getcwd(), 'watchout/data/raw_deepfashion_dataset/Anno'))
    category_path = os.path.join(os.getcwd(), 'watchout/data/raw_deepfashion_dataset/Anno/list_category_img.txt')
    # create_path(path,"list_category_img.txt")
    category_data = pd.read_csv(category_path, sep=r"\s*",delimiter=':   ',engine='python', skiprows=[0], header=0)
    eval_data = Eval(head=head)

跟踪结果:

  

回溯(最近通话最近一次):文件“ C:/ Users / Muhammad   Khalid / Desktop / WOMaster / train.py“,第88行,在       tf.app.run()

     

文件“ C:\ Users \ Muhammad   Khalid \ Anaconda3 \ lib \ site-packages \ tensorflow \ python \ platform \ app.py”,   40行       _run(main = main,argv = argv,flags_parser = _parse_flags_tolerate_undef)文件“ C:\ Users \ Muhammad   Khalid \ Anaconda3 \ lib \ site-packages \ absl \ app.py“,第299行,正在运行       _run_main(main,args)

     

文件“ C:\ Users \ Muhammad   Khalid \ Anaconda3 \ lib \ site-packages \ absl \ app.py“,第250行,在   _run_main       sys.exit(main(argv))

     

文件“ C:/ Users / Muhammad Khalid / Desktop / WOMaster / train.py”,第83行,   在主要       火车()

     

文件“ C:/ Users / Muhammad Khalid / Desktop / WOMaster / train.py”,第51行,   在火车上       锚点,正数,负数= get_train_data(_batch = FLAGS.batch_size,d_sess = sess,   d_tensors = d_tensors)

     

文件“ C:\ Users \ Muhammad Khalid \ Desktop \ WOMaster \ helper.py”,行   150,在get_train_data中       (t_lbl,t_path,p_path),(n_lbl,n_path)= random_triplet_sample(_batch)文件“ C:\ Users \ Muhammad   Khalid \ Desktop \ WOMaster \ helper.py”,第186行,在random_triplet_sample中       ann = Anno(is_train = is_train)

     

文件“ C:\ Users \ Muhammad Khalid \ Desktop \ WOMaster \ helper.py”,行   229,在安诺       category_data = pd.read_csv(category_path,sep = r“ \ s *”,engine ='python',skiprows = [0],header = 0)

     

文件“ C:\ Users \ Muhammad   Khalid \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py“,第702行,在   parser_f       返回_read(filepath_or_buffer,kwds)

     

文件“ C:\ Users \ Muhammad   Khalid \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py“,第435行,在   _读       数据= parser.read(行)

     

文件“ C:\ Users \ Muhammad   Khalid \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py“,第1139行,   在读       ret = self._engine.read(nrows)

     

文件“ C:\ Users \ Muhammad   Khalid \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py“,第2415行,   在读       alldata = self._rows_to_cols(content)

     

文件“ C:\ Users \ Muhammad   Khalid \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py“,第3066行,   在_rows_to_cols中       self._alert_malformed(msg,row_num +1)

     

文件“ C:\ Users \ Muhammad Khalid \ Anaco enter code here nda3 \ lib \ site-packages \ pandas \ io \ parsers.py”,第2835行,在   _alert_畸形       引发ParserError(msg)

     

pandas.errors.ParserError:预期为51 fie`在此内联输入代码   290,见58。错误可能是由于在引用时忽略了引号   使用了多字符定界符。

0 个答案:

没有答案