Python - read_csv()不会删除注释

时间:2017-10-25 20:40:20

标签: python dataframe

我不确定这个问题是否可用,但我遇到了一个大问题。

我有几个.csv文件,他们在顶部有一些注释行'#'。

为了处理数据文件,我试图这样做:

dataframe = pd.read_csv(file, header = None, comment='#')

有些文件效果不错,但其他文件没有

有些评论被删除,但其他评论则没有。所以数据帧很乱。

我不知道为什么会这样。 我该如何解决?我应该上传奇怪的文件吗?

修改

我发现了可删除评论与不可删除评论之间的区别。

如果评论有逗号,则不会删除。为什么会这样?

# This comment is removed
# This comment is removed.
# This comment is not removed,
# ,This comment is not removed
# This comment is, not removed
User,Age,Gender
user1,22,female
user2,30,male
user3,25,male
user4,23,female

数据框是:

0  # This comment is not removed,  NaN     NaN
1  # ,This comment is not removed  NaN     NaN
2  # This comment is, not removed  NaN     NaN
3                            User  Age  Gender
4                           user1   22  female
5                           user2   30    male
6                           user3   25    male
7                           user4   23  female

1 个答案:

答案 0 :(得分:0)

我解决了我的问题。

包含逗号的所有评论都有引号...

我无法在python提示符和LibreOffice中看到它。我不知道为什么,但只有逗号注释引用。

请原谅我的愚蠢。