如何在Mac OS X终端中显示日文字符?

时间:2011-05-04 05:33:05

标签: macos unicode localization character-encoding lexical-analysis

所以我正在运行MeCab(http://mecab.sourceforge.net/#download)进行单词分段并对日语句子进行形态分析。但是,当我运行程序时,由于Mac OS X终端中的某些编码问题,我看到了abracadabra。我用google搜索了主题,添加了Dfile.encoding选项,在.inputrc中添加了以下3行:

set convert-meta off
set meta-flag on
set output-meta on

没有任何作用。有关如何在Mac OS X终端中显示日文字符的任何想法?这是程序test.java的运行输出:

env DYLD_LIBRARY_PATH=. /usr/bin/java -Dfile.encoding=utf-8 test
0.98pre3
å¤  ̾»ì,°ìÈÌ,*,*,*,*,*
ª郎ã µ­¹æ,°ìÈÌ,*,*,*,*,*
¯ä  ̾»ì,¸Çͭ̾»ì,Áȿ¥,*,*,*,*
º郎にこのæ  µ­¹æ,°ìÈÌ,*,*,*,*,*
¬ã  ̾»ì,¥µÊÑÀܳ,*,*,*,*,*
    µ­¹æ,°ìÈÌ,*,*,*,*,*
æ¸  ̾»ì,°ìÈÌ,*,*,*,*,*
¡ã  µ­¹æ,³ç
    BOS/EOS,*,*,*,*,*,*,*,*
å   ̾»ì,°ìÈÌ,*,*,*,*
ª郎  µ­¹æ,°ìÈÌ,*,*,*
¯   ̾»ì,¸Çͭ̾»ì,Áȿ¥,*,*
º郎にこ    µ­¹æ,°ìÈÌ,*,*,*
¬   ̾»ì,¥µÊÑÀܳ,*,*,*,
    µ­¹æ,°ìÈÌ,*,*,*
æ   ̾»ì,°ìÈÌ,*,*,*,*
¡   µ­¹æ,³ç¸̳«,*,*,*,*
    µ­¹æ,°ìÈÌ,*,*,*
    BOS/EOS,*,*,*,*,*,*,*,*
EOS

2 个答案:

答案 0 :(得分:1)

我原以为这是默认设置,但您可以尝试从首选项... 设置中选择“Unicode(UTF-8)”作为字符编码,高级国际。如果已设置,您可能需要确认您的程序输出实际上是以UTF-8编码的。它可能是Shift-JIS,EUC,甚至是UTF-16?在这种情况下,请尝试从首选项... 编码启用这些编码。

答案 1 :(得分:0)

在此之后

% cd mecab-ipadic-2.7.0-xxxx
% ./configure --with-charset=utf8
% sudo make
% sudo make install

'mecab -D'的输出是

% cd mecab-java-0.98pre3
% mecab -D
filename:    /usr/local/lib/mecab/dic/ipadic/sys.dic
version:    102
charset:    utf8
type:    0
size:    392126
left size:    1316
right size:    1316

这是运行测试程序的输出。

bash-3.2$ env DYLD_LIBRARY_PATH=. /usr/bin/java test
0.98pre3
??    ??,????,??,?,*,*,??,???,???
?    ??,???,*,*,*,*,?,?,?
??    ??,????,??,?,*,*,??,???,???
?    ??,???,??,*,*,*,?,?,?
??    ???,*,*,*,*,*,??,??,??
?    ??,??,*,*,*,*,?,??,??
?    ??,???,??,*,*,*,?,?,?
??    ??,??,*,*,?????,???,??,???,???
?    ???,*,*,*,????,???,?,?,?
?    ??,??,*,*,*,*,?,?,?
EOS

    BOS/EOS,*,*,*,*,*,*,*,*
??    ??,????,??,?,*,*,??,???,???
?    ??,???,*,*,*,*,?,?,?
??    ??,????,??,?,*,*,??,???,???
?    ??,???,??,*,*,*,?,?,?
??    ???,*,*,*,*,*,??,??,??
?    ??,??,*,*,*,*,?,??,??
?    ??,???,??,*,*,*,?,?,?
??    ??,??,*,*,?????,???,??,???,???
?    ???,*,*,*,????,???,?,?,?
?    ??,??,*,*,*,*,?,?,?
    BOS/EOS,*,*,*,*,*,*,*,*
EOS

编码工作我缺少什么?

P / S:所有日语编码都在首选项 - 终端中的编码中启用,Mac OS X终端中的编码(首选项 - 设置 - 高级 - 国际)是UTF-8。