如何从Tags中获取文本?

时间:2015-07-17 09:37:00

标签: php html dom xpath domdocument

我有一些问题。如何在html ??

中的标签之间获取文本
<img src="img.png" title="name1 - desc1"> <img src="img2.png" title="name2 - desc2">

例如,我想得到&#34; 5ce5dc85-466d-a1cc-efe7-70bdd5183dfb&#34;。 我试过了:

<ReviewsClientModel xmlns:i="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://schemas.datacontract.org/2004/07/Microsoft.OneStore.Site.Models">
<Items>
<ReviewsClientModel.ReviewClientModel>
<HelpfulNegative>0</HelpfulNegative>
<HelpfulPositive>2</HelpfulPositive>
<IsPublished>true</IsPublished>
<IsTakenDown>false</IsTakenDown>
<Rating xmlns:d4p1="http://schemas.datacontract.org/2004/07/Microsoft.OneStore.Site.Models.ViewModels">
<ReviewId>5ce5dc85-466d-a1cc-efe7-70bdd5183dfb</ReviewId>
<ReviewText>I downloaded this app it had someone in his eyes its kinda black so I don't know who it is.my cousin thinks its not scary but I get creeped out wen I saw him myself. Whoevers not scared then just wow just wow. FOR SAFETY DONT DOWNLOAD</ReviewText>
<SubmittedDateTime>2015-06-25T20:13:05.633</SubmittedDateTime>
<Title>FOR SAFETY DON"T PLAY</Title>
<UserId>985157380267961</UserId>
<UserName>natalie</UserName>
<ViolationsFound>false</ViolationsFound>
</ReviewsClientModel.ReviewClientModel>

我用Curl下载网站,我保存在$ str。

1 个答案:

答案 0 :(得分:2)

这个答案假设你想使用Javascript。

您可以使用Pure JavaScript HTML Parser解析html。

检查该博客以获取有关该库的文档。可能会有点过时。

编辑:

LarsH告诉我你想在PHP中使用XML scraper。虽然我应该检查你的示例代码以实际检查它是什么,但它确实有助于提醒人们你想要它。

至于答案,我不熟悉php,DOM应该能够很好地处理这个问题。

此外,here是过去的回答,这是使用DOM解析HTML的一个很好的例子。应该很容易与XML一起使用它。希望有所帮助。