我试图遍历一个文件夹中的多个CSV文件,并将每个文件解析为一个数据帧,然后获取每个字段的数据类型。在开始循环之前,我正在尝试解析单个CSV文件,并且遇到一些问题。这就是我现在正在使用的。
import pandas as pd
# CSV file
csv_file = 'C:\\path\\ARMINDEX.CSV'
# read cvs with pandas read_csv
df = pd.read_csv(csv_file)
df.dtypes
答案 0 :(得分:2)
您有管道“ |”分隔字段,您可以在下面使用正则表达式分隔符sep="|"
进行尝试,但是可以使用skipinitialspace=True
来在分隔符后跳过空格。
import pandas as pd
# CSV file
csv_file = 'C:\\path\\ARMINDEX.CSV'
# read cvs with pandas read_csv
df = pd.read_csv(csv_file, sep="|", skipinitialspace=True, header=None)
如果需要为定界的Feilds分配名称以获取名称,则可以尝试。.
df = pd.read_csv(csv_file, sep="|", skipinitialspace=True, index_col=False, newCols=['Col1', 'Col2', 'Col3', 'Col4'])