如何获取阿拉伯语网站的HTML代码?

时间:2014-03-29 07:36:57

标签: php html character-encoding

我使用此代码获取HTML:

<?php
header('Content-Type: text/html; charset=utf-8');
$html = file_get_html("http://www.google.com/");
echo $html;
...

但是,当我尝试获取this site的HTML时,响应会显示不正确的字符:

���moY�&�9����i�[S$%ٲ�9������l�l/���F"H�H�VDPJ����˲59��[��v���R�Vɖ3KY��_A����_�  ��so�1�N��T�E"#nܸ��s��=�  ��������?�?�������  ���|������0Vk��Z�2o��E۪  ү�XF�ny���;v�R�ܦ���F�Ƨe˷  ��g����{�������}

2 个答案:

答案 0 :(得分:0)

试试这个

<?php
header('Content-Type: text/html; charset=utf-8');
$content=file_get_contents('http://www.kaktos.ir');
echo '<pre>'.htmlspecialchars($content).'<code>'; 
?>

对我有用..

无论如何,这将回应html标签, 如果你只想重现页面,你显然只需要

<?php
header('Content-Type: text/html; charset=utf-8');
echo file_get_contents('http://www.kaktos.ir');
?>

答案 1 :(得分:0)

尝试添加

<meta charset="UTF-8">

开幕前

<?php

或尝试更改页面编码以便阅读

如果您打算将内容保存到数据库中 我建议使用带有utf8_general_ci搭配的表

由于