Java url-query html特殊字符(google)

时间:2012-10-28 17:31:01

标签: java url translation google-translate

我的Java应用程序出了问题。我有一个大文本,有时包括“ a ”,“ br ”和“ p ”html标签。

该文字需要通过谷歌翻译进行翻译。我强迫(!)对以下内容进行翻译查询:

http://translate.google.com/m?hl=en&sl=auto&tl=" + tl + "&ie=UTF-8&prev=_m&q="+URLEncoder.encode(text);

现在我的问题是这些讨厌的标签。首先,我用文本分析替换所有链接:

text.replaceAll("<a (.*) href=\"(.*)\">(.*)</a>", "$2");

我的问题是:当我将此文本传递给GT时,它只删除所有链接,因此我没有返回文本链接,只返回文本的其余部分。

如果我尝试用 NON - 替换链接传递文本 - 如果链接href很长(比如我的链接,因为它们很长),它只是将它完全裁剪掉,所以,例如,

  

一   href =“AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAASDADSADSADSADASAAAAAAAAAASADDSADSADASDASDSA”将变为普通的“a”(之后一切都空白)

我该怎么办?如何让它正常工作,以免它在文本中打扰我的链接?

提前致谢!

P.S我没有其他选择使用任何其他API,仅查询!

0 个答案:

没有答案