我正在使用Azure搜索Blob索引器的预览。应编入索引的所有信息都包含在blob元数据中。在测试时我遇到了元数据编码的问题:
由于Azure存储Blob元数据值必须是有效的HTTP标头值,我们必须编码非ASCII字符(请参阅Invalid character exception when adding Metadata to a CloudBlob)。如果我正确研究的话,http标头值的标准编码是Mime Header Encoding(如https://www.ietf.org/rfc/rfc2047.txt中所述)。
执行此操作时,索引器将包含编码值,这不适合搜索。我没有找到一种方法让blob索引器为索引字段解码这些值,因为元数据字段是逐字添加的(来源:https://azure.microsoft.com/en-us/documentation/articles/search-howto-indexing-azure-blob-storage/#ContentSpecificMetadata)
我知道Azure Blob Indexer处于预览状态,但我正在尝试记录尝试使用Azure搜索Blob索引器时遇到的一些问题!
答案 0 :(得分:0)
这是我们的雷达。请投票支持UserVoice suggestion以帮助我们确定此工作的优先顺序。 我们可能会将此作为base-64解码功能,因为RFC2047编码相对模糊。谢谢!