我正在使用read_html()
pandas函数来读取html表,最后使用ExcelWriter
和to_excel
将其转换为excel。但是因为我的表有一个索引列,所以这是我使用read_html()
时得到的:
data = pd.read_html(url)
Output:
[ Unnamed: 0 1 3
0 0 3 5
1 1 5 6
2 2 7 2
3 3 4 4
4 4 5 6
5 5 6 7
6 6 4 8
7 7 7 7
8 8 8 8
9 9 9 9]
当我做的时候
writer = pd.ExcelWriter('example1.xlsx')
data[0].to_excel(writer,sheet_name= 'Sheet1', index=False)
我在excel文件中获得了一个未命名的索引列。我还使用了index = False
和drop
函数,但它给出的错误为Can't drop None
。
答案 0 :(得分:0)
我相信如果你需要删除列 SELECT CASE WHEN rn = 1 THEN 'Name: '
WHEN rn =2 THEN 'Year: '
WHEN rn = 3 THEN 'Day: '
WHEN rn = 4 THEN 'Month: ' END || result "Results"
FROM
(
WITH TEST (col) AS
(SELECT 'Jayson,1990,3,july' FROM dual)
SELECT REGEXP_SUBSTR(col, '[^,]+', 1, LEVEL) result, ROWNUM rn
FROM TEST
connect BY LEVEL <= REGEXP_COUNT(col, ',') + 1
);
和索引使用:
0
对于检查列名称,如果可能,请将其转换为data[0].drop(0, axis=1).to_excel(writer,sheet_name= 'Sheet1', index=False)
:
list