所以我正在运行MeCab(http://mecab.sourceforge.net/#download)进行单词分段并对日语句子进行形态分析。但是,当我运行程序时,由于Mac OS X终端中的某些编码问题,我看到了abracadabra。我用google搜索了主题,添加了Dfile.encoding选项,在.inputrc中添加了以下3行:
set convert-meta off
set meta-flag on
set output-meta on
没有任何作用。有关如何在Mac OS X终端中显示日文字符的任何想法?这是程序test.java的运行输出:
env DYLD_LIBRARY_PATH=. /usr/bin/java -Dfile.encoding=utf-8 test
0.98pre3
å¤ ̾»ì,°ìÈÌ,*,*,*,*,*
ª郎ã µ¹æ,°ìÈÌ,*,*,*,*,*
¯ä ̾»ì,¸Çͭ̾»ì,Áȿ¥,*,*,*,*
º郎にこのæ µ¹æ,°ìÈÌ,*,*,*,*,*
¬ã ̾»ì,¥µÊÑÀܳ,*,*,*,*,*
µ¹æ,°ìÈÌ,*,*,*,*,*
æ¸ ̾»ì,°ìÈÌ,*,*,*,*,*
¡ã µ¹æ,³ç
BOS/EOS,*,*,*,*,*,*,*,*
å ̾»ì,°ìÈÌ,*,*,*,*
ª郎 µ¹æ,°ìÈÌ,*,*,*
¯ ̾»ì,¸Çͭ̾»ì,Áȿ¥,*,*
º郎にこ µ¹æ,°ìÈÌ,*,*,*
¬ ̾»ì,¥µÊÑÀܳ,*,*,*,
µ¹æ,°ìÈÌ,*,*,*
æ ̾»ì,°ìÈÌ,*,*,*,*
¡ µ¹æ,³ç¸̳«,*,*,*,*
µ¹æ,°ìÈÌ,*,*,*
BOS/EOS,*,*,*,*,*,*,*,*
EOS
答案 0 :(得分:1)
我原以为这是默认设置,但您可以尝试从首选项... ,设置中选择“Unicode(UTF-8)”作为字符编码,高级,国际。如果已设置,您可能需要确认您的程序输出实际上是以UTF-8编码的。它可能是Shift-JIS,EUC,甚至是UTF-16?在这种情况下,请尝试从首选项... ,编码启用这些编码。
答案 1 :(得分:0)
在此之后
% cd mecab-ipadic-2.7.0-xxxx
% ./configure --with-charset=utf8
% sudo make
% sudo make install
'mecab -D'的输出是
% cd mecab-java-0.98pre3
% mecab -D
filename: /usr/local/lib/mecab/dic/ipadic/sys.dic
version: 102
charset: utf8
type: 0
size: 392126
left size: 1316
right size: 1316
这是运行测试程序的输出。
bash-3.2$ env DYLD_LIBRARY_PATH=. /usr/bin/java test
0.98pre3
?? ??,????,??,?,*,*,??,???,???
? ??,???,*,*,*,*,?,?,?
?? ??,????,??,?,*,*,??,???,???
? ??,???,??,*,*,*,?,?,?
?? ???,*,*,*,*,*,??,??,??
? ??,??,*,*,*,*,?,??,??
? ??,???,??,*,*,*,?,?,?
?? ??,??,*,*,?????,???,??,???,???
? ???,*,*,*,????,???,?,?,?
? ??,??,*,*,*,*,?,?,?
EOS
BOS/EOS,*,*,*,*,*,*,*,*
?? ??,????,??,?,*,*,??,???,???
? ??,???,*,*,*,*,?,?,?
?? ??,????,??,?,*,*,??,???,???
? ??,???,??,*,*,*,?,?,?
?? ???,*,*,*,*,*,??,??,??
? ??,??,*,*,*,*,?,??,??
? ??,???,??,*,*,*,?,?,?
?? ??,??,*,*,?????,???,??,???,???
? ???,*,*,*,????,???,?,?,?
? ??,??,*,*,*,*,?,?,?
BOS/EOS,*,*,*,*,*,*,*,*
EOS
编码工作我缺少什么?
P / S:所有日语编码都在首选项 - 终端中的编码中启用,Mac OS X终端中的编码(首选项 - 设置 - 高级 - 国际)是UTF-8。