SyntaxError:python阿拉伯语编码

时间:2016-08-29 20:06:20

标签: python encoding arabic

我有这个代码 - 我正在使用Python 2.7-:

#!/usr/bin/python
# -*- Coding: UTF-8 -*-
import nltk
from nltk.tokenize import StanfordTokenizer
sentence = u"السلام عليكم و رحمة الله و بركاته"
print StanfordTokenizer().tokenize(sentence)

我将代码保存在名为example.py的文件中,当我在终端中编写python example.py时出现以下错误:

File "example.py", line 5 
SyntaxError: Non-ASCII character '\xd8' in file example.py on line 5, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

我已经将编码类型声明为UTF-8。那么问题是什么?但是,如果我在终端中逐行运行代码,那么它正在运行并且没有错误。

1 个答案:

答案 0 :(得分:1)

  

......第一行或第二行必须与常规行匹配       表达式“^ [\ t \ v] #。?coding [:=] [\ t] *([-_。a-zA-Z0-9] +)”。

source

您的编码声明与该正则表达式不匹配。 c需要小写。