将文本从Tex文件编码为UTF-8格式

时间:2014-07-31 19:39:11

标签: java encoding utf-8 character-encoding latex

我的 .tex 文件可以包含来自 Latin,Cp ....,ISO -....或UTF的通用编码类型 - .. 或任何。我需要对此文本文件进行编码以解析内容,然后将其存储到某种类型的数据库类型,如SQLite等。当我使用java(只有编程语言,我可以使用)时会出现问题,所以如果 tex 包含例如日本符号或其他任何符号,它会解析此变量char 错误。你有建议如何将文本编码为通用,我可以在解析之后(我的解析器只是从命令中提取内容等等。)

\begin{japanese}
日本語は\textbf{難しい}!
\end{japanese}

但不仅是Japanase编码,而且是一般的。我知道,存在MathJax,但我需要解析内容并首先将其存储到数据库中。

谢谢

0 个答案:

没有答案