以下是我的程序,它返回一个空列表,它应该返回值' 3月17日,请告诉我这里我做错了什么。
import requests
from lxml import html
newline="http://www.moneycontrol.com/financials/20microns/balance-sheetVI/2M"
try:
page = requests.get(newline, timeout=5)
except requests.Timeout:
pass
except requests.ConnectionError:
pass
except requests.ReadTimeout:
pass
tree = html.fromstring(page.content)
yrs = tree.xpath('//*[@id="mc_mainWrapper"]/div[3]/div[2]/div[3]/div[2]/div[2]/div[2]/div[1]/table[2]/tbody/tr[1]/td[2]')
print(yrs)
答案 0 :(得分:2)
您不应在XPath中使用tbody
标记,因为它实际上不存在于页面源中,而是在页面呈现时由浏览器添加。跳过它:
.../table[2]/tbody/tr[1]...
- > .../table[2]//tr[1]...