我有这个代码 - 我正在使用Python 2.7-:
#!/usr/bin/python
# -*- Coding: UTF-8 -*-
import nltk
from nltk.tokenize import StanfordTokenizer
sentence = u"السلام عليكم و رحمة الله و بركاته"
print StanfordTokenizer().tokenize(sentence)
我将代码保存在名为example.py的文件中,当我在终端中编写python example.py时出现以下错误:
File "example.py", line 5
SyntaxError: Non-ASCII character '\xd8' in file example.py on line 5, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
我已经将编码类型声明为UTF-8。那么问题是什么?但是,如果我在终端中逐行运行代码,那么它正在运行并且没有错误。
答案 0 :(得分:1)
......第一行或第二行必须与常规行匹配 表达式“^ [\ t \ v] #。?coding [:=] [\ t] *([-_。a-zA-Z0-9] +)”。
您的编码声明与该正则表达式不匹配。 c
需要小写。