我正在尝试从其中一个网址中读取字符:http://www.searchgurbani.com/hukum/sis_ganj
使用以下代码:
String htmltext=null;
String inputLine;
URL urlinstance = new URL(url);
BufferedReader in = new BufferedReader(
new InputStreamReader(urlinstance.openStream()));
while ((inputLine = in.readLine()) != null)
htmltext+=inputLine;
in.close();
htmltext = htmltext.getBytes("UTF-8").toString();
System.out.println("HTMLTEXT"+htmltext);
但是当我试图阅读它时,我无法做到这一点。 有人能告诉我如何才能做到这一点。
谢谢, 阿曼
答案 0 :(得分:1)
我认为你无法做任何事情,因为在那个特定的网站上,他们使用了一种特殊的字体,将混乱的废话变成了特殊的字符。
如果您查看网站的来源并向下滚动到文本所在的位置,您可以看到此操作。
@ kenor的回答也可能有所帮助。以下是将该字体添加到Android应用程序中的方法:
assets/fonts/myfont.ttf
Typeface font = Typeface.createFromAssets(getAssets(), "fonts/myfont.ttf");
myTextView.setTypeface(font);
答案 1 :(得分:0)
编码确实是UTF-8,但是来自网站的CSS:
font-family: WebAkharSlim;
这意味着您拥有正确的字符,但它们显示错误,因为您没有使用正确的字体。你可以在这里下载字体:WebAkharSlim download(我不知道有关将字体导入Android应用程序的事情)。