仅从网址

时间:2018-01-12 12:02:22

标签: php html web-scraping plaintext

我想从网址获取所有可见文字。我需要清除所有的HTML代码并获得纯文本。

这个过程不一定非常完美,但我希望文本尽可能干净。

你知道如何让它变得相对简单吗?

谢谢! 哈维。

2 个答案:

答案 0 :(得分:2)

查看strip_tags功能。

strip_tags — Strip HTML and PHP tags from a string

它可以完成这项工作。

答案 1 :(得分:0)

您可以使用$_GET['the names in there']获取网址。

如果您希望获得所有内容,只需重新构建您知道的$_GET['name used in the url']内容。

function get_url(){ return $_GET['name userd'];}

并使用类似的东西