从HTML中获取纯文本/从Android中的String中删除HTML标记

时间:2016-11-16 19:44:14

标签: android html string parsing

我想在我的应用中显示某个网站的某些内容。 以下是它将获得什么输入的示例:

DetectPlayer dp;

private void Awake()
{
    GameObject gameObject = new GameObject("DetectPlayer");
    dp = gameObject.AddComponent<DetectPlayer>();
}

它应该输出如下内容:

<tr class='list even'><td class="list inline_header" colspan="6" >09e  Klasse 9e (Kla)</td></tr>

我试过了

09e  Klasse 9e (Kla)

但它不能按我想要的方式工作。

我正在寻找this问题的答案,但对于Java / Android。

1 个答案:

答案 0 :(得分:0)

您可以尝试Html.fromHtml()而不是replaceAll()

 String plainTextFromHTML = Html.fromHtml(TextsThatContainsHTML).toString();

或者您可以像这样使用Html.fromHtml()replaceAll()

String plainTextFromHTML = Html.fromHtml(TextsThatContainsHTML).toString().replaceAll("\n", "").trim();