我不确定这个问题是否可用,但我遇到了一个大问题。
我有几个.csv文件,他们在顶部有一些注释行'#'。
为了处理数据文件,我试图这样做:
dataframe = pd.read_csv(file, header = None, comment='#')
有些文件效果不错,但其他文件没有
有些评论被删除,但其他评论则没有。所以数据帧很乱。
我不知道为什么会这样。 我该如何解决?我应该上传奇怪的文件吗?
修改
我发现了可删除评论与不可删除评论之间的区别。
如果评论有逗号,则不会删除。为什么会这样?
# This comment is removed
# This comment is removed.
# This comment is not removed,
# ,This comment is not removed
# This comment is, not removed
User,Age,Gender
user1,22,female
user2,30,male
user3,25,male
user4,23,female
数据框是:
0 # This comment is not removed, NaN NaN
1 # ,This comment is not removed NaN NaN
2 # This comment is, not removed NaN NaN
3 User Age Gender
4 user1 22 female
5 user2 30 male
6 user3 25 male
7 user4 23 female
答案 0 :(得分:0)
我解决了我的问题。
包含逗号的所有评论都有引号...
我无法在python提示符和LibreOffice中看到它。我不知道为什么,但只有逗号注释引用。
请原谅我的愚蠢。