使用python在目录中列出中文文件名

时间:2012-07-03 07:23:00

标签: character-encoding python-2.7

我试图列出目录中所有文件的名称和大小,但是当有中文文件时出错,我在Windows 7上使用Python 2.7

这是我的代码

import os

path = '\'
listing = os.listdir(path)
for infile in listing:
    if infile.endswith(".csv"):
        print infile + ";"+ str(os.path.getsize(path + infile))

这是我得到的错误

Traceback (most recent call last):
  File "file_size.py", line 8, in <module>
    print infile + ";"+ str(os.path.getsize(path + infile))
  File "C:\Python27\lib\genericpath.py", line 49, in getsize
    return os.stat(filename).st_size
WindowsError: [Error 123] The filename, directory name, or volume label syntax is incorrect: '\DB?1333366331.436754.048342.csv'

C:\>python file_size.py
  File "file_size.py", line 7
    if infile.endswith(".csv"):
                              ^
IndentationError: unindent does not match any outer indentation level

导致错误的文件的名称是DB表1333366331.436754.048342.csv

我该如何避免这个问题?

提前致谢

1 个答案:

答案 0 :(得分:2)

我会尝试使你的根路径unicode。我的猜测是listdir使用与初始字符串相同的编码,并且在读取非ascii字符时出错。

path = u'\'

来源: http://docs.python.org/library/os.html#os.listdir

“在版本2.3中更改:在Windows NT / 2k / XP和Unix上,如果path是Unicode对象,则结果将是Unicode对象列表。不可解码的文件名仍将作为字符串对象返回。”