如何从HTML表格代码中删除/删除所有格式或样式信息?
我需要删除所有着色,字体大小等。可能会完全删除所有style
和class
属性。
可能我想删除一些标签和属性。删除标记我的意思是保留其内容,但删除开始和结束标记名称。
答案 0 :(得分:0)
几年前我在VB6做过类似的事情。下面复制的是代码。正如您所看到的,代码只是逐个字符地逐步执行HTML并删除<之间的所有内容(包括)。和>标签。希望你可以用你正在使用的任何工具做类似的事情。
Function CleanTags(HTML As String) As String
Dim result As String, b As Boolean, c As String, i As Long
b = False
For i = 1 To Len(HTML)
c = Mid(HTML, i, 1)
If c = "<" Then b = True
If b = False Then result = result & c
If c = ">" Then b = False
Next i
CleanTags = result
End Function