我有一个csv文件,其中包含一串字符串,其中包含字符串中的逗号。如果我想使用pandas读取csv,它会将额外的逗号视为额外的列。这给了我更多行然后预期的错误。我想在字符串周围使用双引号作为解决问题的方法。
这就是csv目前的样子
lead,Chat.Event,Role,Data,chatid
lead,x,Lead,Hello, how are you,1
它应该是什么样子
lead,Chat.Event,Role,Data,chatid
lead,x,Lead,"Hello, how are you",1
在字符串周围使用双引号是最佳解决方案吗?如果是的话我该怎么做?如果没有,你能推荐其他解决方案吗?
答案 0 :(得分:0)
如果您获得了生成csv的原始文件/数据库,则应该使用不同类型的分隔符(默认为逗号)再次执行此操作,您可以在字符串中使用它,例如“|”。 “ (竖条)。
,当用pandas读取csv时,你可以传递参数:
pd.read_csv(file_path, sep="your separator symbol here")
希望有所帮助