这是可行的(在Mac上的终端上):
sudo /Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --headless --disable-gpu --dump-dom https://www.google.com/
上述终端命令使用无头镀铬返回DOM(属于google.com)。
现在是我的问题:
我正在尝试使用Chromium和Selenium-webdriver复制此命令。但是我不确定如何获取DOM。
这是我到目前为止所拥有的:
const webdriver = require('selenium-webdriver');
const chromium = require('chromium');
const chrome = require('selenium-webdriver/chrome');
require('chromedriver');
let options = new chrome.Options();
options.addArguments('--headless');
options.addArguments('--disable-gpu');
options.addArguments('--dump-dom');
const builder = new webdriver.Builder();
builder.forBrowser('chrome');
builder.setChromeOptions(options)
const driver = builder.build();
driver.get('https://google.com');
driver.quit();
此代码无需打印出DOM就可以运行。(--dump-dom标志应该将DOM打印到STDIO)
这是使用Chromium和Selenium尝试获取页面DOM的正确方法吗?还是我应该尝试其他东西?
感谢任何可能认识的人!