Question

我有一个html文件，它被读作字符串..我想解析它并使用<TD colSpan=2>Value :获取值所以我应该从html文件获得大约10个值..我怎么能这样做...我正在尝试使用像

这样的东西

startindex endindex getsubstring

  sMainBeginKeyword = "<td>Value : ";
  sBeginKeyword = "<td>Value : ";
  sEndKeyword = "</td>";

  main_begin_index = result.indexOf(sMainBeginKeyword);
  while (main_begin_index != -1) {
    begin_index = main_begin_index;
    end_index = result.indexOf(sEndKeyword, begin_index);
    String deloc= result.substring(begin_index + sBeginKeyword.length(), end_index);

但这看起来很复杂，我无法检索更多的值。因为我有很多不同关键字的值..

Answer 1

这种事情确实需要使用XML或DOM解析器来完成：尝试使用字符串搜索进行操作会让自己陷入失败之中。

如果您将HTML加载到XML或DOM解析器中，那么您尝试执行的任务使用XPath表示法来查找相关元素将是微不足道的。

您尚未指定您正在使用的语言或平台（并且您提供的代码示例也不足以确定），因此很难更具体。

希望有所帮助。

将HTML解析为字符串以使用关键字获取值

1 个答案: