我正在尝试预处理包含单个单元格内逗号的数据集。我不知道如何处理这类问题。 这是我正在处理的数据集的链接。 :https://www.kaggle.com/fernandol/countries-of-the-world/version/1
我尝试将“,”替换为“。” 。但这并没有应用于单元级别。这是我尝试过的代码
dataset = pd.read_csv("countries of the world.csv")
df=pd.DataFrame(dataset) df['dataset'] = [dataset.replace(',', '.')
for x in df['dataset']]
我希望逗号用“。”代替。还是有其他替代解决方案,请帮帮我。
答案 0 :(得分:0)
您应该在导入时解决有关数据文件中十进制符号的问题。
尝试
dataset = pd.read_csv("countries of the world.csv", decimal=',')
一旦导入,为时已晚或至少需要付出更大的努力才能纠正。