正如我的问题所说,是否可以将hindi字符直接保存到数据库而不对其进行编码。例如,我在jsp页面त५
的文本字段中输入了这个词。我需要保存名称在mysql数据库中。
我问这个的原因是我尝试使用UTF-8编码,甚至在表格中,我创建了这个
CREATE TABLE `hindi` (
`data` varchar(200) COLLATE utf8_unicode_ci NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;
但是它给了我त५
当我在textarea上找回时是正确的印地文字符。这没关系。
但是当我从db检索到pdf时,问题就开始了,我得到त५
请告诉我该怎么办? 字符集和编码都是utf-8
更新 生成pdf的COde
<%@ page language="java" contentType="text/html; charset=UTF-8"
pageEncoding="UTF-8"%>
<%@ page trimDirectiveWhitespaces="true" %>
<%@ page import="javax.servlet.http.*,javax.servlet.*,com.lowagie.text.Document,com.lowagie.text.DocumentException,com.lowagie.text.Paragraph" %>
<%@page import="java.io.*,java.text.SimpleDateFormat,com.lowagie.text.pdf.BaseFont,com.lowagie.text.pdf.PdfContentByte,com.lowagie.text.pdf.PdfTemplate"%>
<%@page import="java.sql.*,java.nio.charset.Charset,com.lowagie.text.pdf.PdfWriter,java.awt.Graphics2D"%>
<%@ page import="java.util.List,java.util.Arrays,java.util.Collections,java.util.*,com.itextpdf.text.pdf.*,com.itextpdf.tool.xml.ElementList,com.itextpdf.text.Rectangle,com.itextpdf.text.Element,com.itextpdf.text.*,com.itextpdf.text.Font,java.awt.Color,com.itextpdf.text.Font.FontFamily,java.util.Date,java.text.*,com.itextpdf.tool.xml.XMLWorkerHelper" %>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>Insert title here</title>
</head>
<body>
<%
List arrlist = new ArrayList();
Class.forName("com.mysql.jdbc.Driver");
Connection con = DriverManager.getConnection("jdbc:mysql://localhost:3306/a", "root", "root");
Statement st=con.createStatement( ResultSet.TYPE_SCROLL_INSENSITIVE,ResultSet.CONCUR_UPDATABLE);
ResultSet rs;
st.executeQuery("SET NAMES UTF8");
rs=st.executeQuery("SELECT * FROM hindi");
while(rs.next()){
arrlist.add(rs.getString("data"));
}
System.out.println(arrlist);
// step 1: creation of a document-object
Document document = new Document();
try {
// step 2:
// we create a writer
PdfWriter writer = PdfWriter.getInstance(
// that listens to the document
document,
// and directs a PDF-stream to a file
new FileOutputStream("C:/Users/hindi.pdf"));
// step 3: we open the document
document.open();
// step 4:
String text = "हो";
//String arialuniTff = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Fonts), "ARIALUNI.TTF");
//String x=new String(,Charset.forName("UTF-8"));
BaseFont bf = BaseFont.createFont("c:/windows/fonts/arialuni.ttf",
BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
for(int i=0;i<2;i++){
String str =(String) arrlist.get(i);
document.add(new Paragraph(str,
new com.lowagie.text.Font(bf, 12)));
}
PdfContentByte cb = writer.getDirectContent();
PdfTemplate tp = cb.createTemplate(100, 50);
cb.addTemplate(tp, 36, 750);
} catch (DocumentException de) {
System.err.println(de.getMessage());
} catch (IOException ioe) {
System.err.println(ioe.getMessage());
}
// step 5: we close the document
document.close();
%>
</body>
</html>
答案 0 :(得分:0)
在生成PDF(charset=utf-8
)时将字符集标题设置为utf-8。
JSP download - application/octet-stream可能是此链接符合您的目的。根据您的要求进行更改。
答案 1 :(得分:0)
在MySQL连接字符串中,您必须添加一些额外的配置,例如
jdbc:mysql://localhost/unicode?useUnicode=true&characterEncoding=UTF-8
我创建了一个可以连接MySQL的连接类。请参阅包含类http://uwudamith.wordpress.com/2011/09/02/how-to-insert-unicode-values-to-mysql-using-java/的链接。这是一个摇摆项目,你可以从那里得到一个小帮助
尝试更改表格结构,如下面的格式
-- -- Database: `unicode` -- CREATE DATABASE `unicode` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; USE `unicode`; -- -------------------------------------------------------- -- -------------------------------------------------------- -- -- Table structure for table `unicode` -- CREATE TABLE IF NOT EXISTS `unicode` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(100) NOT NULL, `job` varchar(50) NOT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 AUTO_INCREMENT=20 ;
答案 2 :(得分:0)
写作时
String text = "ह";
在Java中,该字符串有7个字符。它总是那样。你可能想写
String text = String.valueOf((char)2361) + String.valueOf((char)2379);
或
String text = "\u0939\u094B";
“&”形式仅适用于HTML和XML,而不适用于Java。