Question

我试图遍历一个文件夹中的多个CSV文件，并将每个文件解析为一个数据帧，然后获取每个字段的数据类型。在开始循环之前，我正在尝试解析单个CSV文件，并且遇到一些问题。这就是我现在正在使用的。

import pandas as pd
# CSV file
csv_file = 'C:\\path\\ARMINDEX.CSV'
# read cvs with pandas read_csv
df = pd.read_csv(csv_file)
df.dtypes

Answer 1

您有管道“ |”分隔字段，您可以在下面使用正则表达式分隔符sep="|"进行尝试，但是可以使用skipinitialspace=True来在分隔符后跳过空格。

import pandas as pd
# CSV file
csv_file = 'C:\\path\\ARMINDEX.CSV'
# read cvs with pandas read_csv
df = pd.read_csv(csv_file, sep="|", skipinitialspace=True, header=None)

如果需要为定界的Feilds分配名称以获取名称，则可以尝试。.

df = pd.read_csv(csv_file, sep="|", skipinitialspace=True, index_col=False, newCols=['Col1', 'Col2', 'Col3', 'Col4'])

如何像使用逗号或管道一样解析CSV文件并读入数据框？

1 个答案: