如何在iOS上的Swift中使用Big5编码

时间:2017-05-19 07:07:22

标签: swift xcode encoding swift3 big5

我正在使用Big5编码的中文字符扫描QR码。 (主页概况)

是否有机会在Swift 3中正确解码此字符串?

我在GitHub和Objective-C example上找到了这个SO question,但Swift中没有kCFStringEncodingBig5_HKSCS_1999kCFStringEncodingBig个常量。

更新

我找到了相应的swift变量,所以我现在尝试了以下内容:

func captureOutput(_ captureOutput: AVCaptureOutput!, didOutputMetadataObjects metadataObjects: [Any]!, from connection: AVCaptureConnection!) {
    guard metadataObjects?.count ?? 0 > 0 else {
        return
    }
    guard let metadata = metadataObjects.first as? AVMetadataMachineReadableCodeObject, let code = metadata.stringValue else {
        return
    }
    let big5encoding = String.Encoding(rawValue: CFStringConvertEncodingToNSStringEncoding(CFStringEncoding(CFStringEncodings.big5.rawValue)))
    print("Big5 encoded String: " + (String(data: code.data(using: .nonLossyASCII)!, encoding: big5encoding) ?? "?"))
}

输出:Big5 encoded String: \326\367\322\263\270\305\277\366

如何达到预期输出Big5 encoded String: 主页概况

更新2:

似乎我的QR码包含一些损坏的数据,所以我创建了一个新的Code,这次内容绝对是Big5编码的String(Android App正确读取它)。内容为傳統

当我使用iOS应用程序扫描此代码时,metadata.stringValue返回日语字符串カヌイホ

这到底是怎么回事?

1 个答案:

答案 0 :(得分:2)

CFStringEncodings 被定义为Swift 3中的枚举值:

public enum CFStringEncodings : CFIndex {

    // ...    
    case big5 /* Big-5 (has variants) */
    // ...    
    case big5_HKSCS_1999 /* Big-5 with Hong Kong special char set supplement*/
    // ...    
}

所以你必须转换

CFStringEncodings -> CFStringEncoding -> NSStringEncoding -> String.Encoding

示例:

let cfEnc = CFStringEncodings.big5
let nsEnc = CFStringConvertEncodingToNSStringEncoding(CFStringEncoding(cfEnc.rawValue))
let big5encoding = String.Encoding(rawValue: nsEnc) // String.Encoding

然后big5encoding可用于String(NS)Data之间的转换。

在您的情况下,您有一个每个unicode标量对应的字符串 Big5编码的一个字节。那么以下应该有效:

// let code = "\u{00D6}\u{00F7}\u{00D2}\u{00B3}\u{00B8}\u{00C5}\u{00BF}\u{00F6}"
let bytes = code.unicodeScalars.map { UInt8(truncatingBitPattern: $0.value) }
if let result = String(bytes: bytes, encoding: big5encoding) {
    print(result)
}

或者,使用ISO Latin 1编码映射的事实 Unicode代码将U + 0000 .. U + 00FF指向字节0x00 .. 0xFF:

if let data = code.data(using: .isoLatin1),
    let result = String(data: data, encoding: big5encoding) {
    print(result)
}