如何使用pandas删除第一行?

时间:2017-07-08 14:20:38

标签: python pandas

我已经搜索了与删除行相关的其他问题但找不到有效的问题:

我有一个从工具尖叫青蛙导出的CSV文件,如下所示:

Internal - HTML |               |             |
--------------- | --------------|-------------|
   Address      |   Content     | Status Code |
----------------|---------------|-------------|
www.example.com |   text/html   |   200       |

我想删除第一行包含'内部 - HTML'。使用df.keys()进行分析时,我会收到此信息" Index(['Internal - HTML'], dtype='object')

我想将第二行用作索引,其中包含正确的列标签。

当我使用代码时:

a = pandas.read_csv("internal_html.csv", encoding="utf-8")
a.drop('Internal - HTML')
a.head(3)

我收到此错误:KeyError: 'Internal - HTML'

我也尝试了Remove index name in pandas建议的内容,并尝试重置索引:

a = pandas.read_csv("internal_html.csv", encoding="utf-8")
a.reset_index(level=0, drop=True)
a.head(3)

上述选项均无效。

2 个答案:

答案 0 :(得分:2)

您可以在第一次调用中添加header作为参数,以使用列名和数据开头:

a = pandas.read_csv("internal_html.csv", encoding="utf-8", header=1)

答案 1 :(得分:1)

不完全确定数据在csv中的效果,但我认为您可以在阅读skiprows=1时使用csv

a = pd.read_csv("internal_html.csv", encoding="utf-8")
a.keys()

输出:

Index(['Internal - HTML'], dtype='object')

查看df假设数据采用以下格式):

print(a)

输出:

                            Internal - HTML
Address            Content   Status Code   
www.example.com   text/html     200        

现在,使用skiprows阅读.csv文件:

a = pd.read_csv("internal_html.csv", encoding="utf-8", skiprows=1)
print(a.keys())

输出:

Index(['Address', '   Content', 'Status Code'], dtype='object')

观察数据框a

print(a)

输出:

           Address      Content       Status Code
  0  www.example.com    text/html     200