应用错误收集

我试图将数亿条记录导入bigquery。他们现有的格式是syslog，我手动将它们转换为换行符分隔的JSON文件。在某些情况下，一些行包含的数据不符合SCHEMA的数据类型（例如，文本＆＃34; null＆＃34;而不是为空，而字段是INTEGER）。 / p>

我只能手动修复 - 我们谈论的是30天＆＃39;值得的数据，分成1小时的文件（ - > 720个单独的大文件）。

在BQ文档中，我看到您可以选择忽略未知字段。如果忽略不匹配的数据类型呢？那可能吗？在规划？

我可以调整maxBadRecords配置，但在这种情况下，我将丢失整个记录，而不仅仅是一些损坏的字段，如果可能的话，我不想使用此选项。