我正在尝试构建一个只能使用CSV路径作为输入的CSV解析器。 目前我仍然坚持这个代码,我可以猜到字段分隔符 和一些基本信息。
import pandas as pandas
import csv
class CSVParser:
path = None
delimiter = None
data_frame = None
rows_count = None
columns_count = None
header = None
def __init__(self, csv_path):
self.path = csv_path
self.delimiter = self.__guess_delimiter()
self.data_frame = pandas.read_csv(self.path, delimiter=self.delimiter)
self.rows_count, self.columns_count = self.data_frame.shape
self.header = list(self.data_frame)
def __guess_delimiter(self):
with open(self.path) as csv_file:
sniffer = csv.Sniffer()
dialect = sniffer.sniff(csv_file.read(2048))
delimiter = dialect.delimiter
return delimiter.
我想知道是否有一些简单的方法可以通过读取几个字节来猜测CSV文件的na_rep。