我的数据集看起来像这样,相当大。
我正在尝试将这些数据写入不同的数据帧,每个数据帧对应于后卫、中后卫等。
到目前为止我有这个:
def get_dataset(f):
return pd.read_csv(f)
def split(dataset):
names = dataset.Categories.str.extract(r'([^>]*>[^>]*)').drop_duplicates().values.tolist()
splitframes = [dataset[dataset['Categories'].str.contains(name)] for name in names]
for splitframe in splitframes:
splitframe.to_csv(splitframe.name + '.csv')
def main(file):
dataset = get_dataset(file)
split(dataset)
if __name__ == '__main__':
parser = argparse.ArgumentParser()
parser.add_argument('infile', nargs=1, type=argparse.FileType('r'))
args = parser.parse_args()
main(*args.infile)
我找不到摆脱这个错误的方法 --> TypeError: unhashable type: 'list' 感谢您帮助我弄清楚我正在尝试做的事情有什么问题并解决这个问题。