使用pandas读取和编辑excel文件

时间:2018-05-14 13:19:46

标签: python excel pandas xlsx xlwt

所以,我正在阅读xlsx文件,我需要选择3个特定的列,然后重命名它们,并将每列的前100行传输到新的xlsx文件,将其从原始列中删除。

我现在的代码是从手动编辑的xlsx文件中读取,我在其中重命名列,选择前100个(标题除外)等:

df = pandas.read_excel('test.xlsx', names=['date', 'value', 'source'])
df['date'] = pandas.to_datetime(df['date'], format='%b %d %Y.%f').astype(str)

print(df.head(5))

正如预期的那样返回:

         date    value               source

0  2018-05-01      1                xxxxxxx
1  2018-05-01      1      xxxxxxxxxxxxxxxxx
2  2018-05-02      1      xxxxxxxxxxxxxxxxx
3  2018-05-02      1      xxxxxxxxxxxxxxxxx
4  2018-05-03      1     xxxxxxxxxxxxxxxxxx

有没有办法用pandas自动读取和编辑xlsx文件?其他的库?我是蟒蛇新手,我真的迷失在这里:(

1 个答案:

答案 0 :(得分:3)

好像你需要输出2个文件。一个有前一百行,另一个有剩余。使用pandas.DataFrame.iloc

这很简单
import pandas as pd

df = pd.read_excel('test.xlsx', names=['date', 'value', 'source'])

df.iloc[:100].to_excel('out1.xlsx', index=False)
df.iloc[100:].to_excel('out2.xlsx', index=False)