我尝试用YQL抓取一些网站(对于Appcelerator Titanium移动应用程序)。
我需要的数据在A标签内,但格式为:
<a href="...">
<strong>Drugs</strong> and Culture</font>
</a>
所以,当我运行查询时:
select * from html where url='...' and xpath="//table[2]/tr/td[2]//a"
我明白了:
{"strong": "Drugs", "content": "\n and Culture"}
我需要YQL忽略那些“强”标签并使用文本值进行响应:
{content: "Drugs and Culture"}
你知道怎么做吗?
答案 0 :(得分:0)
我不知道YQL,但产生所需结果的纯XPath表达式是:
normalize-space(//table[2]/tr/td[2]//a)