Question

data = read_csv('claims.csv', sep = ',')
groupby_gender = data.groupby('Gender')            
for gender, value in groupby_gender['Marker1']:
    print(gender, value)

这是我试图对提到的列进行分组的方法，但是“ Marker1”下面有两列，但是当我运行程序时，只显示其中一列。

Gender  Age                 Marker1 
Female  Adult       CR213   381 385
Male    Adult       CR214   385 385
Male    Adult       CR215   385 385
Female  Adult       CR216   381 385

那是桌子。在“ Marker1”列下，有这两个数字。因此，我尝试一起阅读381和385，以便将它们与另一列进行比较。

Answer 1

据我了解，csv格式不支持合并的单元格，因此不确定是否有两个具有相同名称的列，或者是每个单元格包含要分离的两项数据的单个列。

假设是前者，您可以尝试忽略csv文件中的标题，并显式传递要加载的列列表和所需的标题（名称）。

例如如果您需要的列是csv文件中的前两列：

names = ['my_column_0', 'my_column_1']
data = read_csv('claims.csv', sep=',', usecols=[0,1], skiprows=[1], header=None, names=name)

如果是后者，这里的答案可能会有所帮助：How to split a column into two columns?

如何从Excel或.csv文件读取带有一个标题的两列？

1 个答案: