我正在查看是否存在可以从google bigquery导出文件(或表)的校验和的方法。
假设我导出(或下载)了一个名为的文件的示例
来自bigquery的daily-record-2018-07-10
是否有一种方法可以为bigquery提供一些checksum
(如sha1
,md5
等),以便我们可以在我们结束之前预先计算这些校验和开始处理这些文件
这样做的原因是为了确保我们在下载(或导出)表时不会丢失任何信息。我们确实通过网络丢失了一些信息,然后我们可以预先计算校验和并再次尝试导出表格。
答案 0 :(得分:1)
听起来问题可能是关于如何校验一个文件,我确信有足够的资源,但是如果你想校验一个存储的表在BigQuery中,您可以使用此表单的查询:
SELECT BIT_XOR(FARM_FINGERPRINT(TO_JSON_STRING(t)))
FROM MyTable AS t
这会将每一行转换为字符串表示形式,哈希值,然后对结果进行异或,以在表中生成校验和。您也可以在外部表格上使用此功能(例如,云存储或云端硬盘上的文件)。