我有一个excel文件,其中包含存储在每个单元格中的字符串:
rtypl srtyn OCVXZ srtyn
KPLNV KLNWZ bdfgh KLNWZ
xcvwh mvwhd WQKXM mvwhd
GYTR xvnm YTZN YTZN
ngws jklp PLNM jklp
我想阅读excel文件并将其写入csv文件。如下所示:
import pandas as np
import csv
df = pd.read_excel(file, encoding='utf-16')
words= open("words.csv",'wb')
wr = csv.writer(words, dialect='excel')
for item in df:
wr.writerow(item)
但它以分隔的字母表读取每一行而不是字符串。
r,t,y,p,l
我仅限于将文件写为csv,因为我将在具有大量csv文件功能的库中使用结果。关于如何将所有行作为单元格中的字符串读取的任何建议都表示赞赏。
答案 0 :(得分:1)
您可以尝试最简单的解决方案:
# -*- coding: utf-8 -*-
import pandas as pd
df = pd.read_excel(file, encoding='utf-16')
df.to_csv('words.csv', encoding='utf-16')
答案 1 :(得分:0)
添加到zipa:如果excel有多张:您也可以尝试
import pandas as pd
df = pd.read_excel(file, 'Sheet1')
df.to_csv('words.csv')
参考: http://www.gregreda.com/2013/10/26/intro-to-pandas-data-structures/