正确编码批量上传器中的文本

时间:2011-07-05 21:50:04

标签: python google-app-engine character-encoding bulkloader

为批量上传器编码字符串的正确方法是什么。当它在我的文本字段中遇到撇号时,它目前正在拯救。

以下是CSV文件示例:

demo,name,message
FALSE,one,"Welcome message"
FALSE,two,"If you’re having a medical emergency"

这是我的bulkloader.yaml:

transformers:
- kind: Message
  connector: csv
  connector_options:
   encoding: utf-8
   columns: from_header
  property_map:
   - property: demo
     external_name: demo
     import_transform: bool
   - property: name
     external_name: name
     import_transform: str
   - property: message
     external_name: message
     import_transform: str

当我使用这样的样本(文本中有撇号)运行加载程序时,我会收到以下错误...

UnicodeEncodeError:'ascii'编解码器无法对位置x中的字符u'\ u2019'进行编码:序号不在范围内(128)

感谢任何帮助。

1 个答案:

答案 0 :(得分:2)

不是ASCII字符。您应该尝试将属性转换更改为import_transform: unicode