将文章列表的标题,链接和描述解析到表中

时间:2019-01-05 16:15:36

标签: dom

从简单的新闻提要中,我需要解析一些信息。带有Feed的页面具有非常简单的来源

         <div class="" id="article128659">
          <h2><a href="http://www.lifee.cz/trendy/10-jedinecnych-zamku-ceska-ktere-si-muzete-koupit-az-vyhrajete-v-loterii_4130.html" target="_blank">Toužíte po koupi zámku</a></h2>
            <a href="#" target="_blank"><img src="https://external.xx.fbcdn.net/safe_image.php?d=AQDBod9lxjDJfjau&url=http%3A%2F%2Fwww.lifee.cz%2Fdata%2Fmedias%2F33043%2F600x399.jpg&_nc_hash=AQDrD7R1pNxoBk44" /></a>
              <div class="artinfo"><span class="starts">5. 1. 2019 13:00:00</span> <span class="organizer"><a href="/poradatel/lifee" target="_blank">Lifee</a></span></div>
              <p>Kam dál? Dům, či byt? Město, nebo vesnice? Co třeba rovnou zámek! Dnes už není nic zvláštního koupit si zámeckou nemovitost. Pojďte se s námi podívat na ty nejlukrativnější kousky, které jsou v Česku na prodej. Třeba se některý ze zámků na prodej zalíbí zrovna vám a stanete se novou zámeckou paní.</p><p></p><p>5. 1. 2019</p><p>5. 1. 2019</p><hr/>
           </div>

         <div class="" id="article1522315">
          <h2><a href="http://www.lifee.cz/trendy/10-jedinecnych-zamku-ceska-ktere-si-muzete-koupit-az-vyhrajete-v-loterii_4130.html" target="_blank">Toužíte po koupi zámku</a></h2>
            <a href="#" target="_blank"><img src="https://external.xx.fbcdn.net/safe_image.php?d=AQDBod9lxjDJfjau&url=http%3A%2F%2Fwww.lifee.cz%2Fdata%2Fmedias%2F33043%2F600x399.jpg&_nc_hash=AQDrD7R1pNxoBk44" /></a>
              <div class="artinfo"><span class="starts">5. 1. 2019 13:00:00</span> <span class="organizer"><a href="/poradatel/lifee" target="_blank">Lifee</a></span></div>
              <p>Kam dál? Dům, či byt? Město, nebo vesnice? Co třeba rovnou zámek! Dnes už není nic zvláštního koupit si zámeckou nemovitost. Pojďte se s námi podívat na ty nejlukrativnější kousky, které jsou v Česku na prodej. Třeba se některý ze zámků na prodej zalíbí zrovna vám a stanete se novou zámeckou paní.</p><p></p><p>5. 1. 2019</p><p>5. 1. 2019</p><hr/>
           </div>

'            我想获得简单的表格或列表 的 1)h2标题, 2)h2 a hrefs, 3)p

这是我的代码,它解析页面中的所有链接。您能帮我正确设置吗?

    <?php 
    /*** a new dom object ***/ 
    $dom = new domDocument; 
    $dom->loadHTMLFile('https://www.example.com'); 
    /*** load the html into the object ***/ 
    $dom->loadHTML($html); 
    /*** discard white space ***/ 
    $dom->preserveWhiteSpace = false;  

    foreach($dom->getElementsByTagName('a') as link) {
    # Show the <a href>
    echo $link->getAttribute('href');
    echo "<br />";
    }
    ?> '

感谢您提前提出想法

0 个答案:

没有答案