在Java中将损坏的字符转换为适当的值

时间:2016-03-20 01:20:27

标签: java android xml jsoup

我目前正在阅读外部XML文件。

撇号字符'呈现为'和é(带重音的e)在我正在阅读的RSS源中表示为Ã,我的Android应用程序是从歌曲标题和音乐艺术家名称中读取的。

我当前的代码从XML读取,但原始XML文件在表示这些字符等方面存在问题。这并不总是发生,但我想弄清楚如何正确阅读。我是否可以在Java中更改XML的编码,或者有没有办法将这些类型的字符转换为它们应该是什么?

编辑:事实证明,以UTF-8查看XML页面可以正确呈现字符。有没有办法使用Jsoup库以UTF-8编码读取XML文档?

1 个答案:

答案 0 :(得分:3)

通过defulat @echo off SETLOCAL ENABLEDELAYEDEXPANSION set /P "PrimaryApplicantFirst=Enter First Name: " call :toUpperFirst %PrimaryApplicantFirst% echo %PrimaryApplicantFirst% pause ------------------------------------------------------------------------ :toUpperFirst str set "name=%~1" set first_letter=%name:~0,1% set last_letters=%name:~1% for %%# in (A B C D E F G H I J K L M N O P Q R S T U V W X Y Z) do ( set first_letter=!first_letter:%%#=%%#! ) set "PrimaryApplicantFirst=%first_letter%%last_letters%" echo %PrimaryApplicantFirst% SETLOCAL DISABLEDELAYEDEXPANSION EXIT /b 将在http标头中使用Jsoup来呈现文件,但您可以将编码类型显式传递给Content-Type方法,如下所示:

Jsoup.parse()