非拉丁字符&哎哟

时间:2011-05-10 09:41:13

标签: php mysql cakephp utf-8 character-encoding

我开始了解Cake PHP,它已经发现了关于PHP / MySQL字符集内容的最佳实践的一般性问题,我希望可以在这里得到解答。

我的(练习)系统包含一个电影的mysql表。此列表源自Excel工作表,该工作表已导出为CSV,并通过phpMyAdmin导入。

我注意到具有更多“异国情调”字形的标题在浏览器中呈现问题,例如Amélie中的é。使用Cake或普通PHP,它呈现为?,除非通过htmlentities转换为é。具有特殊字符的链接根本不会呈现。

如果我使用我的蛋糕输入表单输入<alt>0233,则会在源代码中正确呈现,但&Atilde;&copy;通过htmlentities呈现。

经过快速SO搜索后,我决定UTF-8可以解决问题,因此我

  • 将PHP源代码和CSV文件编码更改为UTF-8
  • 确保<meta>的东西在那里(它已经通过Cake的默认布局)。
  • 确保我的浏览器认为该文档是UTF-8(他们这样做)
  • 将MySQL数据库上的排序规则更改为utf-8 general_ci(作为有缺陷的UTF-8选项的受过教育的攻击)
  • 删除并重新导入我的数据

然而,我仍然被卡住了。我注意到phpMyAdmin设法在浏览记录时在其HTML源中“正确”呈现字符。

我觉得文档编码是罪魁祸首,然而,我想知道是否有人可以提供最佳答案:

  • 将数据从Excel移动到MySQL以保留字形的最佳方法是什么?
  • 我的表格的最佳设置是什么?
  • 我更喜欢使用UTF-8本地显示é之类的内容,我可以在Cake中做些什么来避免对htmlentities这样的调用进行大量调用,即是否有配置设置或方式我设置了使这更友好,让像Html->link这样的Cake本地助手工作吗?

一些代码,以防万一:

电影控制器摘录..

function index() {
        $this->set('movies' , $this->Movie->find('all'));

}

index.ctp视图摘录

<?php foreach ($movies as $movie): ?>
<tr>
    <td><?php echo $movie['Movie']['id']; ?></td>
    <td><?php echo htmlentities($movie['Movie']['title']); ?>
    <td><?php echo $this->Html->link($movie['Movie']['title'] , 
    array('controller' => 'movies' , 'action' => 'view' , $movie['Movie']['id'])); ?>
    </td>

    <td><?php echo $this->Html->link("Edit", 
    array('action' => 'edit' , $movie['Movie']['id'])); ?>
    </td>

    <td>
    <?php echo $this->Html->link('Delete', array('action' => 'delete', $movie['Movie']['id']), null, 'Are you sure?')?>
    </td>

</tr>
<?php endforeach; ?>

提前感谢任何帮助/提示。

2 个答案:

答案 0 :(得分:3)

确保在导入数据时将MySQL连接设置为UTF-8。排序规则仅用于排序和比较,而不用于保存数据。

您可以使用SQL文件开头的SET NAMES 'utf-8';设置连接的字符集。

答案 1 :(得分:1)

这个问题经常出现在这里。

UTF8应该可行。确保:

  1. 您的数据库排序规则使用utf8(utf8 bin general)

  2. 您的html文档编码标记设置为utf8

  3. 非常重要 - 大多数人都忘记了这一点 - 确保所有源文件都保存为utf8。在PC上使用notepad ++或在mac上使用Coda / TextMate / TextWrangler来确保编码正确。如果您不这样做,可能会对角色进行一些转换/重新解释

  4. 编辑:如果你在整个过程中使用utf8编码,那么你就不需要它了。