如何在Swift中访问NSMetadataItem的文本内容(kMDItemTextContent)?

时间:2019-05-08 15:51:42

标签: swift cocoa spotlight

我正在尝试使用Swift访问NSMetadataQuery结果的文本表示。但是,结果中不存在包含文件的文本表示形式的属性kMDItemTextContent。我可以确认该属性应该存在,因为使用该属性搜索文件可以正常工作。

到目前为止,这是我的代码:

import Foundation
import Cocoa

class Indexer {
    public let spotlight = NSMetadataQuery()
    let backgroundQueue = OperationQueue()

    init() {
        let nc = NotificationCenter.default

        spotlight.searchScopes = []
        spotlight.predicate = NSPredicate(fromMetadataQueryString: "kMDItemKind == *")

        nc.addObserver(forName: NSNotification.Name.NSMetadataQueryDidFinishGathering, object: nil, queue: self.backgroundQueue, using:{_ in
            self.spotlight.disableUpdates()
            for i in 0..<self.spotlight.resultCount {
                let result = self.spotlight.result(at: i) as! NSMetadataItem
                print("----- \(result.value(forAttribute: "kMDItemDisplayName") ?? "No title") -----")
                for attribute in result.attributes {
                    print("\(attribute):", result.value(forAttribute: attribute) ?? "No content")
                }
            }
            self.spotlight.enableUpdates()
        })

        spotlight.start()
    }
}

一个文件的当前结果如下:

----- n26-csv-transactions.csv -----
kMDItemContentTypeTree: (
    "public.comma-separated-values-text",
    "public.data",
    "public.delimited-values-text",
    "public.plain-text",
    "public.item",
    "public.content",
    "public.text"
)
kMDItemContentType: public.comma-separated-values-text
kMDItemPhysicalSize: 16384
kMDItemDisplayName: n26-csv-transactions.csv
kMDItemKind: CSV Document
kMDItemContentCreationDate: 2019-04-25 17:09:08 +0000
kMDItemContentCreationDate_Ranking: 2019-04-25 00:00:00 +0000
kMDItemContentModificationDate: 2019-04-25 17:09:08 +0000
kMDItemInterestingDate_Ranking: 2019-05-08 00:00:00 +0000
kMDItemUsedDates: (
    "2019-05-07 22:00:00 +0000"
)
kMDItemLastUsedDate: 2019-05-08 10:00:33 +0000
kMDItemLastUsedDate_Ranking: 2019-05-08 00:00:00 +0000
kMDItemUseCount: 3
kMDItemLogicalSize: 591
kMDItemWhereFroms: (
    "https://app.n26.com/download-csv",
    "https://app.n26.com/downloads"
)
kMDItemFSName: n26-csv-transactions.csv
kMDItemFSSize: 591
kMDItemFSCreationDate: 2019-04-25 17:09:08 +0000
kMDItemFSContentChangeDate: 2019-04-25 17:09:08 +0000
kMDItemFSOwnerUserID: 99
kMDItemFSOwnerGroupID: 99
kMDItemFSNodeCount: No content
kMDItemFSInvisible: 0
kMDItemFSTypeCode: 0
kMDItemFSCreatorCode: 0
kMDItemFSFinderFlags: 0
kMDItemFSHasCustomIcon: No content
kMDItemFSIsExtensionHidden: 0
kMDItemFSIsStationery: No content
kMDItemFSLabel: 0

此处似乎缺少kMDItemTextContent属性。

是否有一种方法可以使用Spotlight返回的NSMetadataItem来访问该属性?如果没有,是否还有另一种方法来访问文件的文本表示形式?

1 个答案:

答案 0 :(得分:2)

  

是否可以使用Spotlight返回的NSMetadataItems访问该属性?如果没有,是否还有另一种方法来访问文件的文本表示形式?

总之:不。阅读该属性上的docs

  

包含文档内容的文本表示。多个字段中的数据应使用空格字符作为分隔符进行组合。应用程序的Spotlight导入程序提供此属性的内容。   应用程序可以使用此属性创建查询,但不能直接读取此属性的值。 [强调我的。]

文本内容信息进入Spotlight索引,以便您可以观察到它进行搜索。但是您不能以任何方式自己获取。它不以任何面向公众程序员的形式存在。

(仅举一个例子,现有的mdls命令基本上可以完成代码的工作-您可以通过在流程中运行mdls来避免麻烦。如果您给{终端中的{1}}命令,即使该文件的内容已建立索引,您也不会在属性中看到mdls。)

要了解为什么会这样,请考虑隐私。如果仅由于可以访问Spotlight就能读取用户计算机上每个文件的文本表示形式,那么您将知道该用户计算机上的所有数据。除非您是某种邪恶的黑客,否则您甚至都不想要那样。要找出文件中的内容,请打开(如果可以)。

那么,这个属性又有什么用呢?这样一来,您就可以通过自定义Spotlight导入器以属于您的文件类型为Spotlight提供文本