Question

如何从包含语言字符的文件中仅提取特定语言的字符，字母数字字符英文字母

Answer 1

这取决于几个因素：

最后，

假设您使用的是UTF-8，您不需要基本的标点符号，但可以使用其他符号，并且您不需要任何标准的拉丁字符，但可以使用带重音的字符等，您可以在您使用的任何语言中使用字符串正则表达式函数来搜索所有非Ascii字符。这将消除你可能试图淘汰的大部分内容。

在php中它将是：

$string2 = preg_replace('/[^(\x00-\x7F)]*/','', $string1);

但是，这会删除您可能想要或不想要的行结尾。