从HTML文档中检索单词的数量

时间:2015-09-28 09:23:00

标签: javascript html ruby

我正在尝试从HTML编码的字符串中检索前10个单词。

此刻我正在被空白分裂。问题是标签参数中的空格被识别为单独的单词。

我需要一种机制,它可以让我在Ruby或JavaScript中将HTML文档的格式正确预览作为字符串。

有人有想法吗?

HTML字符串中允许的是列表,段落,颜色等。但没有什么奇特的形式,收音机,iframe,表格或闪光灯

1 个答案:

答案 0 :(得分:0)

如果你需要在Ruby中完成这项工作,你可以使用Nokogiri gem。它非常适合您的工作。 Here您有一些如何使用它的示例。 Nokogiri记录良好且易于使用。