在docker容器中的utf-8解码错误

时间:2018-02-12 17:10:24

标签: python multithreading docker utf-8

我对这个错误感到疯狂。

我有这个字节串:

b'AXX 4 U I T T u N G AXK\nGlobus Fachm\xc3\xa4rkte GmbH & Co.KG\n\nBaumarkt 65719 Hofheim\n\nNordring 5\xe2\x80\x949\nTel :06192\xe2\x80\x94959680 Fax:95968444\n94\n\n#373\n2 SCHNITZEL 6.30 1\nSumme 6.30\nBAR 7.00\nR\xc3\xbcckgeld EUR 0.70\nMwSt Brutto 6.30\n19.00% MwSt Il 1.01\n\nNetto 5 29\n\n12000094 MW,\n\nVielen Dank f\xc3\xbcr Ihren Einkauf\nG\xc3\xbcltig zur Vorlage beim Finanzamt\nUST . I0\xe2\x80\x94Nummer : DE163646243\nAchtung: Bon vor W\xc3\xa4rme, N\xc3\xa4sse und\nSonneneinstrahlung sch\xc3\xbctzen.\n\nKasse/Bon Datum=lieferdatum Kassierer\n1619 12.01.17 12:45 56\n\x0c'

如果我尝试在本地阅读:

print(g.decode('utf-8').strip())

我明白了:

AXX 4 U I T T u N G AXK
Globus Fachmärkte GmbH & Co.KG
Baumarkt 65719 Hofheim
Nordring 5—9
Tel :06192—959680 Fax:95968444
94
#373
2 SCHNITZEL 6.30 1
Summe 6.30
BAR 7.00
Rückgeld EUR 0.70
MwSt Brutto 6.30
19.00% MwSt Il 1.01
Netto 5 29
12000094 MW,
Vielen Dank für Ihren Einkauf
Gültig zur Vorlage beim Finanzamt
UST . I0—Nummer : DE163646243
Achtung: Bon vor Wärme, Nässe und
Sonneneinstrahlung schützen.
Kasse/Bon Datum=lieferdatum Kassierer
1619 12.01.17 12:45 56

但如果我尝试在服务器上,在Docker容器内执行它,完全相同的代码print(g.decode('utf-8').strip())我收到此错误:

Exception in thread Thread-3:
Traceback (most recent call last):
  File "/usr/lib/python3.5/threading.py", line 914, in _bootstrap_inner
    self.run()
  File "/usr/lib/python3.5/threading.py", line 862, in run
    self._target(*self._args, **self._kwargs)
  File "./main.py", line 140, in get_text_aux2
    text_blank = chuck_tesseract.image_to_string(blank_image, lang='deu', mode='1')
  File "./chuck_tesseract.py", line 137, in image_to_string
    print(g.decode('utf-8').strip())
UnicodeEncodeError: 'ascii' codec can't encode character '\xe4' in position 36: ordinal not in range(128)

这对我没有任何意义。

也许,问题出在线程内部,或者我必须在docker容器中设置一些东西。

我读过this issue但它没有带给我任何东西。

也许有人有同样的问题,可以帮助我。

1 个答案:

答案 0 :(得分:0)

Yilun Zhang告诉我答案。

RUN apt-get install locales...

RUN locale-gen de_DE.UTF-8

COPY ./default_locale /etc/default/locale
RUN chmod 0755 /etc/default/locale

ENV PYTHONIOENCODING=utf-8
ENV LC_ALL=de_DE.UTF-8
ENV LANG=de_DE.UTF-8
ENV LANGUAGE=de_DE.UTF-8

default_locale

LANG="de_DE.UTF-8"
LC_COLLATE="de_DE.UTF-8"
LC_CTYPE="de_DE.UTF-8"
LC_MESSAGES="de_DE.UTF-8"
LC_MONETARY="de_DE.UTF-8"
LC_NUMERIC="de_DE.UTF-8"
LC_TIME="de_DE.UTF-8"LC_ALL=
LC_ALL=de_DE.UTF-8

它完美无缺。