我已经搜索了与删除行相关的其他问题但找不到有效的问题:
我有一个从工具尖叫青蛙导出的CSV文件,如下所示:
Internal - HTML | | |
--------------- | --------------|-------------|
Address | Content | Status Code |
----------------|---------------|-------------|
www.example.com | text/html | 200 |
我想删除第一行包含'内部 - HTML'。使用df.keys()
进行分析时,我会收到此信息" Index(['Internal - HTML'], dtype='object')
。
我想将第二行用作索引,其中包含正确的列标签。
当我使用代码时:
a = pandas.read_csv("internal_html.csv", encoding="utf-8")
a.drop('Internal - HTML')
a.head(3)
我收到此错误:KeyError: 'Internal - HTML'
我也尝试了Remove index name in pandas建议的内容,并尝试重置索引:
a = pandas.read_csv("internal_html.csv", encoding="utf-8")
a.reset_index(level=0, drop=True)
a.head(3)
上述选项均无效。
答案 0 :(得分:2)
您可以在第一次调用中添加header
作为参数,以使用列名和数据开头:
a = pandas.read_csv("internal_html.csv", encoding="utf-8", header=1)
答案 1 :(得分:1)
不完全确定数据在csv
中的效果,但我认为您可以在阅读skiprows=1
时使用csv
:
a = pd.read_csv("internal_html.csv", encoding="utf-8")
a.keys()
输出:
Index(['Internal - HTML'], dtype='object')
查看df
(假设数据采用以下格式):
print(a)
输出:
Internal - HTML
Address Content Status Code
www.example.com text/html 200
现在,使用skiprows
阅读.csv
文件:
a = pd.read_csv("internal_html.csv", encoding="utf-8", skiprows=1)
print(a.keys())
输出:
Index(['Address', ' Content', 'Status Code'], dtype='object')
观察数据框a
:
print(a)
输出:
Address Content Status Code
0 www.example.com text/html 200