解析雪花中的CEF文件

时间:2021-07-11 11:49:55

标签: snowflake-cloud-data-platform snowflake-schema

我们已经在外部stage s3中暂存了日志文件。暂存的日志文件是CEF文件格式。如何从stage解析CEF文件,将数据移动到snowflake?

1 个答案:

答案 0 :(得分:0)

如果文件具有固定格式(即有记录和字段分隔符,并且每条记录具有相同的列数),那么您可以将其视为文本文件并创建适当的文件格式。

如果文件具有半结构化格式,那么您应该能够将其加载到变体列中 - 您可以为每个文件创建多行还是仅创建一行取决于文件结构。如果您只能为每个文件创建一条记录,那么您可能会遇到文件大小问题,因为变体列具有最大文件大小。

一旦数据位于变体列中,您应该能够对其进行处理以从中提取可用数据。如果有 Snowflake 可以处理的结构(例如 xml 或 json),那么您可以使用本机功能。如果没有可识别的结构,那么您必须在存储过程中编写自己的解析逻辑。

或者,您可以尝试找到另一种工具,将您的文件转换为 xml/json 格式,然后 Snowflake 可以轻松处理这些文件。