我正在尝试从HTML编码的字符串中检索前10个单词。
此刻我正在被空白分裂。问题是标签参数中的空格被识别为单独的单词。
我需要一种机制,它可以让我在Ruby或JavaScript中将HTML文档的格式正确预览作为字符串。
有人有想法吗?
HTML字符串中允许的是列表,段落,颜色等。但没有什么奇特的形式,收音机,iframe,表格或闪光灯
答案 0 :(得分:0)
如果你需要在Ruby中完成这项工作,你可以使用Nokogiri gem。它非常适合您的工作。 Here您有一些如何使用它的示例。 Nokogiri记录良好且易于使用。