很抱歉,如果问题听起来没有问题。我的问题是我有一个文本文件,需要将数据导入数据库。
阅读过程没问题,当我print_r
这条线是正确的时候。
然后我需要通过制表符(\ t)分隔符将其拆分。然后所有的unicode字符都被破坏了。
这是我尝试的方式:
<!DOCTYPE html>
<html>
<head>
<meta charset=utf-8>
<title>Test page for project XY</title>
</head>
<body>
<h1>Test Page</h1>
<pre>
<?php
include 'ChromePhp.php';
ChromePhp::log('Start read file!');
ini_set("default_charset", 'utf-8');
$handle = fopen("input.txt", "r");
if ($handle) {
while (($line = fgets($handle)) !== false) {
// process the line read.
print_r($line); // if print the $line here, it's fine
$myArray = preg_split("/[\t]/", $line); //=> broken unicode, adding u not work
$myArray = explode("\t", $line);//=> same
print_r($myArray);
}
fclose($handle);
} else {
// error opening the file.
// ChromePhp::log('Cant open file!');
print_r ('Cant open file!');
}
?>
</pre>
</body>
</html>
更新:我尝试了这个作为建议,但仍然不起作用:(
mb_internal_encoding("UTF-8");
mb_regex_encoding("UTF-8");
$tab="\t";
$myArray=(mb_split($tab,$line));
print_r($myArray);`
答案 0 :(得分:0)
尝试在终端中运行它,我认为你有错误。尝试将标头指令放在php中,并将其命名为codepage = UTF-8。您还需要检查php文件代码页本身。