php的方面包括(解析)

时间:2012-11-01 14:39:13

标签: php seo html-parsing

使用php include是否安全,包括对搜索引擎等网页的语义含义至关重要的方面。

例如,您是否可以将所有页面的<h1></h1>标题全部虹吸到包含?谷歌蜘蛛,作为一个例子,实际上能看到这些标题吗?有没有......被动解析...如果你愿意的话,哪个不会看到依赖脚本执行的html?

或者这样的排除是否仅限于客户端脚本,例如javascript?

2 个答案:

答案 0 :(得分:3)

Google绝不会看到原始的PHP代码,因为这意味着您的服务器配置错误。您用于构建网页的服务器端语言/进程与最终用户无关,他们应该看到的只是html。

由于所有蜘蛛都看到的是html,如果你是从一个普通的旧.html文件,.php文件,.whatever_extension_you_want文件等服务它并不重要......只要它看起来就像网页到达客户端时一样。

e.g。你可以走到一个荒谬的极端,让一个网页的每一个 CHARACTER 完成除了单个字符包括,例如。

less_than.txt:

<

h.txt:

h

t.txt:

t

m.txt:

m

l.txt:

l

greater_than.txt

>

的index.php:

<?php
include('less_than.txt');
include('h.txt');
include('t.txt');
include('m.txt');
include('l.txt');
include('greater_than.txt');

非常丑陋,低效率,但这是用户在浏览器的“查看源”中看到的内容:

<html>

答案 1 :(得分:0)

这与你提出的问题类似,试试代码......

的index.php

<html>
<head>
</head>
<body>
  <?php include("header.php"); ?>
  <p><?php echo $superhero;?></p>
</body>
</html>

的header.php

<h1>This is a page</h1>
<?php
    // create a variable that we want to show in the main page
    $superhero = "batman";
?>

以上应输出类似

的内容
<html>
<head>
</head>
<body>
  <h1>This is a page</h1>
  <p>batman</p>
</body>
</html>