Biq查询导出作业配置 - 字符串中的双引号

时间:2018-02-03 15:49:24

标签: google-bigquery

以下是将biq查询表数据以csv格式导出到存储的导出作业配置。发生的事情是,如果字符串列中包含双引号的数据,则在提取时,我会得到两个双引号。比如说

Column_data : xxdsadsa "sdfsada" adfadfsaa

Exported_column_data : xxdsadsa ""sdfsada"" adfadfsaa

这是作业配置

job_data = {
        'configuration': {
            'extract': {
                'sourceTable': {
                    'projectId': xxxxx,
                    'datasetId': xxxxxx,
                    'tableId': xxxx
                },
                'printHeader': False,
                'fieldDelimiter': '\t',
                'compression': 'GZIP',
                'destinationUris': [gs://xxxxxxx],
                'destinationFormat': CSV,

            }
        }
    }

service = build('bigquery', 'v2', http=http_auth)
job_collection = service.jobs()
insert_response = job_collection.insert(projectId=project_id, body=job_data).execute(http=http)

有没有办法在从表到存储中提取时抑制两个双引号。我已经看到了作业配置提取属性,无法找到任何属性。感谢帮助

1 个答案:

答案 0 :(得分:0)

如前所述,使用BigQuery Web UI的双引号存在同样的问题。然而,单引号完美无缺。解决方法是,您可以将所有双引号转换为单引号。

您还可以查看configuration.load.quote属性。

预览BigQuery:

enter image description here

导出的CSV表格

enter image description here