将数据从计算引擎实例加载到Big Query时出现问题
我在Big Query中有几个表,我想要做的是使用PySpark导入和转换它们,在云存储中使用json格式保存它,然后将转换后的数据加载回Big Query
我可以导入,转换,保存并将所有表重新加载到Big Query中,除了一个表,我不知道该表有什么问题,每个表的过程都相同,但是这个表返回
CalledProcessError: Command '['bq', 'load', '--source_format', 'NEWLINE_DELIMITED_JSON', '--replace', '--autodetect', 'aws_stitch_clean.orders', 'gs://bucket-business-intelligence-99716/hadoop/tmp/bigquery/pyspark_output/orders/part-*']' returned non-zero exit status 1.
当我尝试将其加载到Big Query
时当我尝试将该表与另一个表连接,然后尝试将其加载到Big Query时,问题仍然存在
你对这个问题有什么想法或解决方案吗?非常感谢你 :)
的解决
我通过删除表格中的phone_number
列来解决这个问题,不确定这些列有什么问题,但它确实有效:)