我有一个php脚本,可以检测给定网址上的关键字密度。
我的问题是,它没有检测到土耳其字符或删除它们。
我通过file_get_contents
方法获取网址内容。这种方法很完美,并且所有内容都带有土耳其字符。
答案 0 :(得分:2)
您似乎正在获取并将file_get_contents
数据转换为UTF-8(可能正确),但您的HTML页面未指定自身的编码。所以可能,任何传入的表单数据都在iso-8859-1中。尝试将utf-8
指定为您的网页编码:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
关于编码基础知识的强制性阅读链接:The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)