我有这个html:
<div class="et_pb_text_inner">
<h3 style="text-align: center;"><i class="fal fa-ruler-combined"></i><br /> 1672 Square Feet</h3>
<p style="text-align: center;">
First Floor 1085 s.f.<br />
Second Floor 587 s.f.<br />
Porches 393 s.f.<br />
Covered Parking 642 s.f.<br />
Storage 187 s.f.<br />
Under Roof 2894 s.f.
</p>
</div>
我的Xpath代码是:
//div[@class='et_pb_text_inner']/p/text()
但是它只给我第一个中断线之前的文本。
First Floor 1085 s.f.
是否有一种方法可以仅仅获取段落元素内的所有数据?有没有办法划定界限?
我想要一个这样的字符串:
First Floor 1085 s.f.<br />Second Floor 587 s.f.<br />Porches 393 s.f.<br />Covered Parking 642 s.f.<br />Storage 187 s.f.<br />Under Roof 2894 s.f.
因此,在此之后,我将尝试清除数据。
我是xpath表达式的新手。
在此先感谢您的帮助。 =)很抱歉我的英语不好。 :P
我的.py代码是:
import requests
from lxml import html
resp = requests.get(
url="https://tyreehouseplans.com/shop/house-plans/beach-house-plans/crew-cut-house-plan/",
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
)
tree = html.fromstring(html=resp.text)
title = tree.xpath("//div[@class='et_pb_module_inner']/h1/text()")[0]
dimensions = tree.xpath("//div[@class='et_pb_text_inner']/p/text()")[0]
print(title)
print(dimensions)
答案 0 :(得分:2)
$user = User::with(['TaskIssues','TotalSessionsGroupByDate'])
->withCount(['TotalSessions'])
->whereId(16)
->first();
$user->TotalSessionsGroupByDate = $user->TotalSessionsGroupByDate->count();
返回一个文本节点,text()
标签包含6个这样的节点,因此您需要删除索引<p>
。您还需要给出更准确的[0]
才能删除不必要的结果
xpath
将给出一个包含6个字符串的列表
dimensions = tree.xpath("//h3[contains(., '1672 Square Feet')]/following-sibling::p/text()")