我正在尝试使用Swift访问NSMetadataQuery
结果的文本表示。但是,结果中不存在包含文件的文本表示形式的属性kMDItemTextContent
。我可以确认该属性应该存在,因为使用该属性搜索文件可以正常工作。
到目前为止,这是我的代码:
import Foundation
import Cocoa
class Indexer {
public let spotlight = NSMetadataQuery()
let backgroundQueue = OperationQueue()
init() {
let nc = NotificationCenter.default
spotlight.searchScopes = []
spotlight.predicate = NSPredicate(fromMetadataQueryString: "kMDItemKind == *")
nc.addObserver(forName: NSNotification.Name.NSMetadataQueryDidFinishGathering, object: nil, queue: self.backgroundQueue, using:{_ in
self.spotlight.disableUpdates()
for i in 0..<self.spotlight.resultCount {
let result = self.spotlight.result(at: i) as! NSMetadataItem
print("----- \(result.value(forAttribute: "kMDItemDisplayName") ?? "No title") -----")
for attribute in result.attributes {
print("\(attribute):", result.value(forAttribute: attribute) ?? "No content")
}
}
self.spotlight.enableUpdates()
})
spotlight.start()
}
}
一个文件的当前结果如下:
----- n26-csv-transactions.csv -----
kMDItemContentTypeTree: (
"public.comma-separated-values-text",
"public.data",
"public.delimited-values-text",
"public.plain-text",
"public.item",
"public.content",
"public.text"
)
kMDItemContentType: public.comma-separated-values-text
kMDItemPhysicalSize: 16384
kMDItemDisplayName: n26-csv-transactions.csv
kMDItemKind: CSV Document
kMDItemContentCreationDate: 2019-04-25 17:09:08 +0000
kMDItemContentCreationDate_Ranking: 2019-04-25 00:00:00 +0000
kMDItemContentModificationDate: 2019-04-25 17:09:08 +0000
kMDItemInterestingDate_Ranking: 2019-05-08 00:00:00 +0000
kMDItemUsedDates: (
"2019-05-07 22:00:00 +0000"
)
kMDItemLastUsedDate: 2019-05-08 10:00:33 +0000
kMDItemLastUsedDate_Ranking: 2019-05-08 00:00:00 +0000
kMDItemUseCount: 3
kMDItemLogicalSize: 591
kMDItemWhereFroms: (
"https://app.n26.com/download-csv",
"https://app.n26.com/downloads"
)
kMDItemFSName: n26-csv-transactions.csv
kMDItemFSSize: 591
kMDItemFSCreationDate: 2019-04-25 17:09:08 +0000
kMDItemFSContentChangeDate: 2019-04-25 17:09:08 +0000
kMDItemFSOwnerUserID: 99
kMDItemFSOwnerGroupID: 99
kMDItemFSNodeCount: No content
kMDItemFSInvisible: 0
kMDItemFSTypeCode: 0
kMDItemFSCreatorCode: 0
kMDItemFSFinderFlags: 0
kMDItemFSHasCustomIcon: No content
kMDItemFSIsExtensionHidden: 0
kMDItemFSIsStationery: No content
kMDItemFSLabel: 0
此处似乎缺少kMDItemTextContent
属性。
是否有一种方法可以使用Spotlight返回的NSMetadataItem
来访问该属性?如果没有,是否还有另一种方法来访问文件的文本表示形式?
答案 0 :(得分:2)
是否可以使用Spotlight返回的NSMetadataItems访问该属性?如果没有,是否还有另一种方法来访问文件的文本表示形式?
总之:不。阅读该属性上的docs:
包含文档内容的文本表示。多个字段中的数据应使用空格字符作为分隔符进行组合。应用程序的Spotlight导入程序提供此属性的内容。 应用程序可以使用此属性创建查询,但不能直接读取此属性的值。 [强调我的。]
文本内容信息进入Spotlight索引,以便您可以观察到它进行搜索。但是您不能以任何方式自己获取。它不以任何面向公众程序员的形式存在。
(仅举一个例子,现有的mdls
命令基本上可以完成代码的工作-您可以通过在流程中运行mdls
来避免麻烦。如果您给{终端中的{1}}命令,即使该文件的内容已建立索引,您也不会在属性中看到mdls
。)
要了解为什么会这样,请考虑隐私。如果仅由于可以访问Spotlight就能读取用户计算机上每个文件的文本表示形式,那么您将知道该用户计算机上的所有数据。除非您是某种邪恶的黑客,否则您甚至都不想要那样。要找出文件中的内容,请打开(如果可以)。
那么,这个属性又有什么用呢?这样一来,您就可以通过自定义Spotlight导入器以属于您的文件类型为Spotlight提供文本至。