'Normalize'上传的文件名为php

时间:2016-01-08 16:16:00

标签: php

我正在开发一个法语网站,用户在某些情况下需要上传文件(pdfs),我想用原始文件名保存这些文件,当我尝试这样做时,我发现PHP无法保存如果这个文件名包含这样的字母(é,ç,à,...),那么我认为我应该用它们的英文等价物替换所有那些法语字符(é-> e,àa,... )我发现了这个answer但它对我不起作用...... 这是不起作用的代码:

p:rowExpansion

...当我从$ _FILES中检索文件名字符串作为上面的代码时,这不起作用,但当我用简单的字符串作为$unwanted_array = array('Š'=>'S', 'š'=>'s', 'Ž'=>'Z', 'ž'=>'z', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A', 'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a', 'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i', 'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o', 'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'þ'=>'b', 'ÿ'=>'y' ); $ori_fn=strtolower(basename($_FILES['userfile']['name'])); $mod_fn = strtr($ori_fn, $unwanted_array); echo "Before : ".$ori_fn."<br>"; echo "After : ".$mod_fn."<br>";//$mod_fn same as $ori_fn nothing changed ! 进行测试时,它的工作正常!

1 - 问题是什么?

2-解决方案是什么?

3 - 是否有更好的方法来规范化文件名?!

注意我的意思是不起作用:strtr不会改变收到的字符串中的任何内容($ _ FILES ['userfile'] ['name'])!

1 个答案:

答案 0 :(得分:1)

strtolower不适用于Unicode字符串,您应该使用mb_strtolower

$ori_fn = mb_strtolower(basename($_FILES['userfile']['name']), 'UTF-8');
$mod_fn = strtr($ori_fn, $unwanted_array);

但是,PHP具有iconv功能:

$ori_fn = strtolower(basename($_FILES['userfile']['name']));
$mod_fn = iconv('UTF8', 'ASCII//TRANSLIT', $ori_fn);