以下是将biq查询表数据以csv格式导出到存储的导出作业配置。发生的事情是,如果字符串列中包含双引号的数据,则在提取时,我会得到两个双引号。比如说
Column_data : xxdsadsa "sdfsada" adfadfsaa
Exported_column_data : xxdsadsa ""sdfsada"" adfadfsaa
这是作业配置
job_data = {
'configuration': {
'extract': {
'sourceTable': {
'projectId': xxxxx,
'datasetId': xxxxxx,
'tableId': xxxx
},
'printHeader': False,
'fieldDelimiter': '\t',
'compression': 'GZIP',
'destinationUris': [gs://xxxxxxx],
'destinationFormat': CSV,
}
}
}
service = build('bigquery', 'v2', http=http_auth)
job_collection = service.jobs()
insert_response = job_collection.insert(projectId=project_id, body=job_data).execute(http=http)
有没有办法在从表到存储中提取时抑制两个双引号。我已经看到了作业配置提取属性,无法找到任何属性。感谢帮助
答案 0 :(得分:0)
如前所述,使用BigQuery Web UI的双引号存在同样的问题。然而,单引号完美无缺。解决方法是,您可以将所有双引号转换为单引号。
您还可以查看configuration.load.quote属性。
预览BigQuery:
导出的CSV表格