我正在用Python编写基本的爬虫程序。为了提取数据,我试图编写单个组件,这些组件提取页面的特定部分,如此
def get_business_name():
Executes('//h1/text()') # Gets the Business name
def get_business_address():
Executes('//h2/text()') # Gets the Business address
def get_business_contact_number():
Executes('h3//text()') # Gets the Business contact number
然后我单独调用每个函数以获取有关业务的所有数据
现在,即使上述方法可读,它是否有效?
使用Union |
运营商一次调用所有查询会更好吗?
def get_all_business_data():
Executes('//h1//text() | //h2//text() | //h3//text()')
这将不太可读
我的问题是,
在单个查询中使用联合运算符时是否会显着提升性能?
如果是,我怎样才能使我的代码更易读/可维护?