如何从Excel或.csv文件读取带有一个标题的两列?

时间:2018-09-10 13:43:21

标签: python python-3.x pandas csv

data = read_csv('claims.csv', sep = ',')
groupby_gender = data.groupby('Gender')            
for gender, value in groupby_gender['Marker1']:
    print(gender, value)

这是我试图对提到的列进行分组的方法,但是“ Marker1”下面有两列,但是当我运行程序时,只显示其中一列。

Gender  Age                 Marker1 
Female  Adult       CR213   381 385
Male    Adult       CR214   385 385
Male    Adult       CR215   385 385
Female  Adult       CR216   381 385

那是桌子。在“ Marker1”列下,有这两个数字。因此,我尝试一起阅读381和385,以便将它们与另一列进行比较。

1 个答案:

答案 0 :(得分:0)

据我了解,csv格式不支持合并的单元格,因此不确定是否有两个具有相同名称的列,或者是每个单元格包含要分离的两项数据的单个列。

假设是前者,您可以尝试忽略csv文件中的标题,并显式传递要加载的列列表和所需的标题(名称)。

例如如果您需要的列是csv文件中的前两列:

names = ['my_column_0', 'my_column_1']
data = read_csv('claims.csv', sep=',', usecols=[0,1], skiprows=[1], header=None, names=name)

如果是后者,这里的答案可能会有所帮助:How to split a column into two columns?