从其他语言网站获取UTF-8字符

时间:2013-06-06 14:47:07

标签: java jar web-scraping

我正在尝试从匈牙利语网站上获取数据。该网站还有一些UTF-8字符,即ő。因此,当我从网站上删除数据时,它会将特殊字符更改为某些未知字符。我需要用相同的匈牙利语语言获取数据。 现在我正在使用gargoylesoftware.htmlunit jar文件来废弃数据。 请告诉我如何通过使用任何特定方法实现这一点,还是我需要一些其他jar文件? 这是我正在使用的一段代码。

 HtmlElement doctorInstitutionTitlePhone =  page.getFirstByXPath(".//*[@id='orvosok_kartyajinak_helye']/table/tbody/tr[2]/td[1]/div[3]");
 String sDITP = doctorInstitutionTitlePhone.asText();

0 个答案:

没有答案