我正在使用Access VBA进行某些Web抓取。
在大多数地方,它适用于抓取表格列,但我发现当存在诸如
的字符串时 Mon&day
实际上返回Mon&day
。
我正在使用IE对象进行网页抓取
Set ie = CreateObject("InternetExplorer.Application")
我正在抓取单个细胞:
tdRow(subCounter).innerHTML
我知道&
是HTML中的特殊字符,这可能就是这种情况的原因。有没有办法让HTML照原样返回,而不是让VBA做一些进一步的解析?
答案 0 :(得分:1)
使用 innerText 仅获取文本,不带空格和内部元素标签。