从Compute Engine将数据加载到Big Query中返回非零退出状态1

时间:2018-03-18 23:50:21

标签: python pyspark google-cloud-platform google-bigquery google-compute-engine

将数据从计算引擎实例加载到Big Query时出现问题

我在Big Query中有几个表,我想要做的是使用PySpark导入和转换它们,在云存储中使用json格式保存它,然后将转换后的数据加载回Big Query

我可以导入,转换,保存并将所有表重新加载到Big Query中,除了一个表,我不知道该表有什么问题,每个表的过程都相同,但是这个表返回

CalledProcessError: Command '['bq', 'load', '--source_format', 'NEWLINE_DELIMITED_JSON', '--replace', '--autodetect', 'aws_stitch_clean.orders', 'gs://bucket-business-intelligence-99716/hadoop/tmp/bigquery/pyspark_output/orders/part-*']' returned non-zero exit status 1.

当我尝试将其加载到Big Query

当我尝试将该表与另一个表连接,然后尝试将其加载到Big Query时,问题仍然存在

你对这个问题有什么想法或解决方案吗?非常感谢你 :)

解决

我通过删除表格中的phone_number列来解决这个问题,不确定这些列有什么问题,但它确实有效:)

0 个答案:

没有答案