我的Java应用程序出了问题。我有一个大文本,有时包括“ a ”,“ br ”和“ p ”html标签。
该文字需要通过谷歌翻译进行翻译。我强迫(!)对以下内容进行翻译查询:
http://translate.google.com/m?hl=en&sl=auto&tl=" + tl + "&ie=UTF-8&prev=_m&q="+URLEncoder.encode(text);
现在我的问题是这些讨厌的标签。首先,我用文本分析替换所有链接:
text.replaceAll("<a (.*) href=\"(.*)\">(.*)</a>", "$2");
我的问题是:当我将此文本传递给GT时,它只删除所有链接,因此我没有返回文本链接,只返回文本的其余部分。
如果我尝试用 NON - 替换链接传递文本 - 如果链接href很长(比如我的链接,因为它们很长),它只是将它完全裁剪掉,所以,例如,
一 href =“AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAASDADSADSADSADASAAAAAAAAAASADDSADSADASDASDSA”将变为普通的“a”(之后一切都空白)
我该怎么办?如何让它正常工作,以免它在文本中打扰我的链接?
提前致谢!
P.S我没有其他选择使用任何其他API,仅查询!