Question

我有这个代码 - 我正在使用Python 2.7-：

#!/usr/bin/python
# -*- Coding: UTF-8 -*-
import nltk
from nltk.tokenize import StanfordTokenizer
sentence = u"السلام عليكم و رحمة الله و بركاته"
print StanfordTokenizer().tokenize(sentence)

我将代码保存在名为example.py的文件中，当我在终端中编写python example.py时出现以下错误：

File "example.py", line 5 
SyntaxError: Non-ASCII character '\xd8' in file example.py on line 5, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

我已经将编码类型声明为UTF-8。那么问题是什么？但是，如果我在终端中逐行运行代码，那么它正在运行并且没有错误。

Answer 1

......第一行或第二行必须与常规行匹配表达式“^ [\ t \ v] ＃。？coding [：=] [\ t] *（[-_。a-zA-Z0-9] +）”。

source

您的编码声明与该正则表达式不匹配。 c需要小写。

SyntaxError：python阿拉伯语编码

1 个答案: