使用Goutte的刮刀没有&#39; <br/>&#39;

时间:2017-03-16 22:49:06

标签: web-scraping goutte

在原始页面

"trader and bla........... <b>have come across</b> ............blabla"

在我的抓取结果中

"trader and bla........... <b>have</b> <br> <b>come across</b> ............blabla"

问题是:我想获取标记<b>中的值,其中该值至少有3个单词。因此,我应该能够获取值have come across,但我无法得到它,因为havecome across不在一个标记中。如何获得与原始页面相同的抓取结果?

0 个答案:

没有答案