BigQuery表包含神秘的重复行

时间:2014-07-24 23:40:34

标签: google-bigquery

我有一个声称包含87行的BigQuery表,但查询时返回5916行。我希望看到的每一行有68个相同的(根据count(*)/ group by)副本。

此表是使用Java SDK创建的,方法是使用publicdata:samples.wikipediaWHERE id=1711042查询到Write Preference Overwrite Table SELECT * FROM [publicdata:samples.wikipedia] WHERE id=1711042的目标表。目标表已经存在,具有相同的87行。我可以多次重新运行此查询+表格覆盖,而不会更改神秘行数。

自己运行safe.com:fme-big-query-api:testsuite.pr46492_nonpublic_read会返回87行。

使用相同的查询创建新表会导致可查询的行数正确。我希望如果我删除有问题的表并从头开始重新创建它将会被修复。

如果有人想证实我的说法,我想我已经让这个问题{{1}}对全世界都可见了。

它腐败了吗?这是我的错吗?有什么方法可以避免将来破坏桌子吗?所有建议都表示赞赏。

1 个答案:

答案 0 :(得分:2)

感谢您的报告;您已经遇到了回归,我们在某些情况下会在查询结果中显示截断的数据。 (只有当您有一个作为查询结果写出的表时才会发生这种情况)。问题只出在表的解释上,表本身并没有损坏。

这已经修复,现在修复工作正常。我重试了查询,SELECT COUNT(*) ...现在返回正确的行数。