ExpatError:使用由变音字符引起的SimpleXMLRPCServer时格式不正确(令牌无效)

时间:2015-09-07 18:59:08

标签: python simplexmlrpcserver

我花了很长时间才找出错误的一些具体原因。我正在编写一个简单的XML RPC服务器,它允许您进行目录列表以及可能的其他只读操作。我已经创建了一个简单的方法来列出所有文件夹和文件,并将它们表示为字典:

def list_dir(self, dirname):
    """Returns list of files and directories as a dictionary, where key is name and values is either 'file' or 'dir'"""
    dirname = os.path.abspath(os.path.join(self.server.cwd,dirname))
    #Check that the path doesn't lead above 
    if dirname.find(self.server.cwd)==-1:
        raise SecurityError("There was an attempt to browse in %s wthich is above the root working directory %s."%(dirname, self.server.cwd))
    check_for_valid_directory(dirname)
    #Looping through directory
    files = [i for i in os.listdir(dirname)]
    #Create associative array
    result = {}
    #Iterate through files
    for f in files:
        fullpath = os.path.join(dirname, f)
        #Appending directories
        if os.path.isdir(fullpath):
            result[f] = "dir"
        else:
            result[f] = "file" 

    print "Sending data", result   
    return result

现在,当目录包含名为Nová složka的文件(或更确切地说文件夹)时,客户端会收到错误而不是所需的列表。当我删除有问题的文件名时,我收到的数据没有错误。我不认为Python库有这个权利 - 参数转换应该是完整的,包括任何unicode的东西,或根本不存在。

但无论如何,我应该如何编码Python库无法处理的数据?

1 个答案:

答案 0 :(得分:1)

您必须确保文件名和路径是unicode对象,并且所有文件名都使用正确的编码。最后一部分可能有点棘手,因为POSIX文件名是字节字符串,并且不要求分区上的所有文件名都必须使用相同的编码进行编码。在这种情况下,除了自己解码名称并以某种方式处理错误或将文件名作为二进制数据而不是(unicode)字符串返回之外,没有什么可以做的。

osos.path中的文件名相关函数如果将unicode字符串作为参数返回unicode字符串。因此,如果您确保dirname的类型为unicode而不是str,那么os.listdir()将返回应该能够通过XML-RPC转换的unicode字符串。