我有一个Adobe AIR应用程序,用户可以在其中处理文件系统中的文本文件。我一直在假设UTF-8,但是如果文本文件是其他编码(例如iso-8859-1或iso-2022-kr),我应该如何确定(最佳猜测)编码类型文本文件,所以我可以将内容读入一个字符串吗?
FileStream.readMultiByte支持an intimidating range of types。
答案 0 :(得分:0)
您可以通过查看文件是否包含标题来尝试猜测,例如BOM。但你永远不会百分百肯定。
看看另一个答案:
How to detect the encoding of a file?
How can I detect the encoding/codepage of a text file
编辑:也许这是猜测方法,它不在AS3中,但它可以帮助:Simple class to automatically detect text file encoding, with English-biased "best guess" heuristic based on byte patterns in the absence of BOM.
此外,如果它是您应用中的一个选项,您可以使用UTF-8,并允许用户以他们选择的其他编码预览文本。