我试图将数亿条记录导入bigquery。他们现有的格式是syslog,我手动将它们转换为换行符分隔的JSON文件。 在某些情况下,一些行包含的数据不符合SCHEMA的数据类型(例如,文本" null"而不是为空,而字段是INTEGER)。 / p>
我只能手动修复 - 我们谈论的是30天'值得的数据,分成1小时的文件( - > 720个单独的大文件)。
在BQ文档中,我看到您可以选择忽略未知字段。如果忽略不匹配的数据类型呢?那可能吗?在规划?
我可以调整maxBadRecords配置,但在这种情况下,我将丢失整个记录,而不仅仅是一些损坏的字段,如果可能的话,我不想使用此选项。