Python CSV:是否可以通过读取一些字节来猜测na_rep?

时间:2017-08-28 15:40:04

标签: python pandas csv na

我正在尝试构建一个只能使用CSV路径作为输入的CSV解析器。 目前我仍然坚持这个代码,我可以猜到字段分隔符 和一些基本信息。

import pandas as pandas
import csv


class CSVParser:
    path = None
    delimiter = None
    data_frame = None
    rows_count = None
    columns_count = None
    header = None

    def __init__(self, csv_path):
        self.path = csv_path
        self.delimiter = self.__guess_delimiter()
        self.data_frame = pandas.read_csv(self.path, delimiter=self.delimiter)
        self.rows_count, self.columns_count = self.data_frame.shape
        self.header = list(self.data_frame)

    def __guess_delimiter(self):
        with open(self.path) as csv_file:
            sniffer = csv.Sniffer()
            dialect = sniffer.sniff(csv_file.read(2048))
            delimiter = dialect.delimiter
        return delimiter.

我想知道是否有一些简单的方法可以通过读取几个字节来猜测CSV文件的na_rep。

0 个答案:

没有答案