有没有办法使用Simple HTML DOM Parser刮掉不在自己标签内的文本?

时间:2015-08-21 15:29:12

标签: php web-scraping simple-html-dom

我正在抓取的HTML结构是:

<section class="arbeidsgiverinfo">
    <h1 id="arbeidsgivernavn">ENITRO AS</h1>
    <p class="details clearfix"><span class="postdel">XXXXXXXXX<br>
    4621 KRISTIANSAND S<br></span> <span class="adressedel"><span class=
    "subdel">Telefon: XXXXXXX<br></span></span> <span class=
    "kommunikasjondel"><span class="subdel"><span>E-post:</span> <a href=
    "mailto:stilling@enitro.no" target=
    "_blank"><span>XXXXXXXXX</span></a></span> <span class=
    "subdel"><span>Web:</span> <a href="http://www.enitro.no" target=
    "_blank"><span>www.enitro.no</span></a></span></span></p>

    <!-- THIS PORTION -->
    Enitro AS leverer konsulenttjenester og løsninger innenfor IT-infrastruktur.
    Enitro har spesialkompetanse spesielt innenfor nettsky, nettverk,
    sikkerhet og backup. Ble etablert i 2007 og er et velrennomert
    IT-selskap i Kristiansand. Vi leter fortiden etter nye salgs
    konsulenter som kan hjelpe oss med å øke salget og utviklingen på Xerox
    porteføljen. Vi leiter etter utadvendte mennesker med stort pågangsmot
    og ønske for å lære og utvikle seg i teknisk salg.
    <!-- /THIS PORTION -->

</section>

这可能吗?我还没有找到办法,我已经在这个问题上搜索了很多。

0 个答案:

没有答案