php5编码:我没有检测到土耳其字符

时间:2010-02-13 17:39:42

标签: php encoding keyword

我有一个php脚本,可以检测给定网址上的关键字密度。

我的问题是,它没有检测到土耳其字符或删除它们。

我通过file_get_contents方法获取网址内容。这种方法很完美,并且所有内容都带有土耳其字符。

您可以看到我的代码here或尝试脚本here

1 个答案:

答案 0 :(得分:2)

您似乎正在获取并将file_get_contents数据转换为UTF-8(可能正确),但您的HTML页面未指定自身的编码。所以可能,任何传入的表单数据都在iso-8859-1中。尝试将utf-8指定为您的网页编码:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

关于编码基础知识的强制性阅读链接:The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)