我使用以下扩展方法来获取子字符串的NSRange数组:
extension String {
func nsRangesOfString(findStr:String) -> [NSRange] {
let ranges: [NSRange]
do {
// Create the regular expression.
let regex = try NSRegularExpression(pattern: findStr, options: [])
// Use the regular expression to get an array of NSTextCheckingResult.
// Use map to extract the range from each result.
ranges = regex.matches(in: self, options: [], range: NSMakeRange(0, self.characters.count)).map {$0.range}
}
catch {
// There was a problem creating the regular expression
ranges = []
}
return ranges
}
}
然而,我没有意识到为什么它有时不起作用。这里有两个类似的案例,一个是作品而另一个不是:
那个有效:
自(字符串):
“וצפן(קרי:יִצְפֹּ֣ן)לַ֭יְשָׁרִיםתּוּשִׁיָּ֑המָ֝גֵ֗ןלְהֹ֣לְכֵיתֹֽם:”
FINDSTR:
“קרי:”
那个没有:
自(字符串):
“לִ֭נְצֹראָרְח֣וֹתמִשְׁפָּ֑טוְדֶ֖רֶךְחסידו(קרי:חֲסִידָ֣יו)יִשְׁמֹֽר:”
FINDSTR:
“קרי:”
(另一种稳定的方法虽然是合适的答案。)
答案 0 :(得分:7)
NSRange
范围以UTF-16代码单位(其中
是NSString
内部使用的,因此长度必须是
self.utf16.count
:
ranges = regex.matches(in: self, options: [],
range: NSRange(location: 0, length: self.utf16.count))
.map {$0.range}
如果是第二个字符串,我们有
let s2 = "לִ֭נְצֹר אָרְח֣וֹת מִשְׁפָּ֑ט וְדֶ֖רֶךְ חסידו (קרי: חֲסִידָ֣יו) יִשְׁמֹֽר׃"
print(s2.characters.count) // 46
print(s2.utf16.count) // 74
这就是为什么你的代码找不到模式的原因。
从 Swift 4 开始,您也可以为整个字符串计算NSRange
NSRange(self.startIndex..., in: self)