我的IMPORTXML功能有时可以工作,但有时却不行。如果他们不这样做,我会收到以下错误:
网址内容的资源超过了最大尺寸。
我尝试下载该网站,然后仅在我拥有的域中托管HTML。当我这样做时,我可以使用IMPORTXML导入,但我的数据显然不会自动更新。
有没有办法通过某种方式强制IMPORTXML函数只查看HTML来克服这个问题?
答案 0 :(得分:1)
我建议使用从技术上抓取所有内容的自定义功能。如果它真的是大量的内容,那么将.disposed(by: rx.disposeBag)
包含在您想要的真实内容周围的内容...例如(.*)
(仅作为例子)
<head>(.*)<\/head>