如何在php中按指定的分隔符拆分unicode字符串?

时间:2017-05-14 16:03:40

标签: php unicode split

很抱歉,如果问题听起来没有问题。我的问题是我有一个文本文件,需要将数据导入数据库。

阅读过程没问题,当我print_r这条线是正确的时候。

然后我需要通过制表符(\ t)分隔符将其拆分。然后所有的unicode字符都被破坏了。

这是我尝试的方式:

<!DOCTYPE html>
<html>
  <head>
    <meta charset=utf-8>
    <title>Test page for project XY</title>
  </head>
  <body>
     <h1>Test Page</h1>
     <pre>
     <?php
include 'ChromePhp.php';
ChromePhp::log('Start read file!');
ini_set("default_charset", 'utf-8');
$handle = fopen("input.txt", "r");
if ($handle) {
    while (($line = fgets($handle)) !== false) {
        // process the line read.
        print_r($line); // if print the $line here, it's fine
        $myArray = preg_split("/[\t]/", $line); //=> broken unicode, adding u not work
        $myArray = explode("\t", $line);//=> same
        print_r($myArray);
    }

    fclose($handle);
} else {
    // error opening the file.
    // ChromePhp::log('Cant open file!');
    print_r ('Cant open file!');
} 
?>


     </pre>
  </body>
</html>

更新:我尝试了这个作为建议,但仍然不起作用:(

mb_internal_encoding("UTF-8");
mb_regex_encoding("UTF-8"); 
$tab="\t";
$myArray=(mb_split($tab,$line));
print_r($myArray);`

1 个答案:

答案 0 :(得分:0)

尝试在终端中运行它,我认为你有错误。尝试将标头指令放在php中,并将其命名为codepage = UTF-8。您还需要检查php文件代码页本身。