如何通过提供servlet,java和html代码将印地文文本打印到网页中

时间:2017-02-21 10:01:22

标签: java html servlets tomcat7

我正在使用servlet,java和一个html代码从以下网址中提取印地文文字:https://hi.wikipedia.org/wiki/%E0%A4%B5%E0%A4%BE%E0%A4%B0%E0%A4%BE%E0%A4%A3%E0%A4%B8%E0%A5%80

我想通过servlet代码显示hindi字体,代码如下:

//Extraction1.java //java file
import java.io.IOException;
import java.net.URL;
import java.util.Scanner;

public class Extraction1 {

 public String toHtmlString(String url) throws IOException 
{
  StringBuilder sb = new StringBuilder();
  for(Scanner sc = new Scanner(new URL(url).openStream()); sc.hasNext(); )
  sb.append(sc.nextLine()).append('\n');
  return sb.toString();
 }
}

MultiParamServlet3.java // servlet文件

import java.io.*;
import javax.servlet.*;
import javax.servlet.http.*;

public class MultiParamServlet3 extends HttpServlet
{
  private static final long serialVersionUID = 1L;

  public void doPost(HttpServletRequest req,HttpServletResponse resp) throws          ServletException,IOException
{
  PrintWriter pw=resp.getWriter();

   resp.setContentType("text/html");

   String[] values=req.getParameterValues("habits");

   Extraction1 t=new Extraction1();
   String s=t.toHtmlString(values[0]).replaceAll("\\<.*?>","");
   pw.println("<html><head><meta charset=\"utf-8\"></head><body>"+s+"</body></html>");

  pw.close(); 
 }
}

index.html // html文件

  <!DOCTYPE html>
  <html>
  <head>
  <meta charset="utf-8">
  <title>Insert title here</title>
  </head>
  <body>
  <form method="Post" action="MultiParamServlet3">
  <Label> <br><br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;      &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n bsp;&nbsp;&nbsp;&nbsp;Enter    the URL : </label>
  <input name='habits' id='t2'>
  <input type="submit" name="submit"> 
 </form>
 </body>
 </html>

servlet程序能够在提取后打印英文文本,但印地文文本转换为????? (问号)。

如何通过servlet程序将印地文文本打印到网页中?

2 个答案:

答案 0 :(得分:0)

您必须设置编码响应。

"text/html"更改为"UTF-8"

resp.setCharacterEncoding("UTF-8");

答案 1 :(得分:-1)

使用apache.commons.lang中的StringEscapeUtils类并实现它:

String output=StringEscapeUtils.unescapeHtml3(responseMessageString);

mathod取决于api版本我使用的是commons.lang 3.3。