我对这个错误感到疯狂。
我有这个字节串:
b'AXX 4 U I T T u N G AXK\nGlobus Fachm\xc3\xa4rkte GmbH & Co.KG\n\nBaumarkt 65719 Hofheim\n\nNordring 5\xe2\x80\x949\nTel :06192\xe2\x80\x94959680 Fax:95968444\n94\n\n#373\n2 SCHNITZEL 6.30 1\nSumme 6.30\nBAR 7.00\nR\xc3\xbcckgeld EUR 0.70\nMwSt Brutto 6.30\n19.00% MwSt Il 1.01\n\nNetto 5 29\n\n12000094 MW,\n\nVielen Dank f\xc3\xbcr Ihren Einkauf\nG\xc3\xbcltig zur Vorlage beim Finanzamt\nUST . I0\xe2\x80\x94Nummer : DE163646243\nAchtung: Bon vor W\xc3\xa4rme, N\xc3\xa4sse und\nSonneneinstrahlung sch\xc3\xbctzen.\n\nKasse/Bon Datum=lieferdatum Kassierer\n1619 12.01.17 12:45 56\n\x0c'
如果我尝试在本地阅读:
print(g.decode('utf-8').strip())
我明白了:
AXX 4 U I T T u N G AXK
Globus Fachmärkte GmbH & Co.KG
Baumarkt 65719 Hofheim
Nordring 5—9
Tel :06192—959680 Fax:95968444
94
#373
2 SCHNITZEL 6.30 1
Summe 6.30
BAR 7.00
Rückgeld EUR 0.70
MwSt Brutto 6.30
19.00% MwSt Il 1.01
Netto 5 29
12000094 MW,
Vielen Dank für Ihren Einkauf
Gültig zur Vorlage beim Finanzamt
UST . I0—Nummer : DE163646243
Achtung: Bon vor Wärme, Nässe und
Sonneneinstrahlung schützen.
Kasse/Bon Datum=lieferdatum Kassierer
1619 12.01.17 12:45 56
但如果我尝试在服务器上,在Docker容器内执行它,完全相同的代码print(g.decode('utf-8').strip())
我收到此错误:
Exception in thread Thread-3:
Traceback (most recent call last):
File "/usr/lib/python3.5/threading.py", line 914, in _bootstrap_inner
self.run()
File "/usr/lib/python3.5/threading.py", line 862, in run
self._target(*self._args, **self._kwargs)
File "./main.py", line 140, in get_text_aux2
text_blank = chuck_tesseract.image_to_string(blank_image, lang='deu', mode='1')
File "./chuck_tesseract.py", line 137, in image_to_string
print(g.decode('utf-8').strip())
UnicodeEncodeError: 'ascii' codec can't encode character '\xe4' in position 36: ordinal not in range(128)
这对我没有任何意义。
也许,问题出在线程内部,或者我必须在docker容器中设置一些东西。
我读过this issue但它没有带给我任何东西。
也许有人有同样的问题,可以帮助我。
答案 0 :(得分:0)
RUN apt-get install locales...
RUN locale-gen de_DE.UTF-8
COPY ./default_locale /etc/default/locale
RUN chmod 0755 /etc/default/locale
ENV PYTHONIOENCODING=utf-8
ENV LC_ALL=de_DE.UTF-8
ENV LANG=de_DE.UTF-8
ENV LANGUAGE=de_DE.UTF-8
和default_locale
:
LANG="de_DE.UTF-8"
LC_COLLATE="de_DE.UTF-8"
LC_CTYPE="de_DE.UTF-8"
LC_MESSAGES="de_DE.UTF-8"
LC_MONETARY="de_DE.UTF-8"
LC_NUMERIC="de_DE.UTF-8"
LC_TIME="de_DE.UTF-8"LC_ALL=
LC_ALL=de_DE.UTF-8
它完美无缺。