我正在努力抓取机器人,我必须抓取网页并“推断”内容。
我有什么:
我想做什么:
在输入框之前获取最接近且可视的文本。如果您要手动执行此操作,这大致转换为在输入框之前单击并在屏幕上向上移动3/4行或大约1英寸。我可以说1英寸,因为我控制窗口大小和其他硬件。
问题:
由于DOM层次结构和CSS定位文本在视觉上更接近,因此页面标记可能并不总是更接近。如何模拟文本选择,就像用户手动操作一样?
尝试范围,但问题是获得正确的元素,因为范围需要开始/结束元素。除了某些原因,当我以编程方式执行此操作时,我会收到javascript / comments其他漏洞,但是当我在屏幕上手动执行并检查浏览器的范围时,它不会发生。