应用错误收集

慢分区读取器影响SpannerIO批读取速度

时间：2018-08-23 22:47:40

标签： google-cloud-platform google-cloud-dataflow apache-beam google-cloud-spanner

我们一直在Google数据流设置中使用SpannerIO.readAll扫描大量数据。将创建ReadOperation和withQuery(query)传递到扳手的withBatching(true)。我注意到，尽管最初吞吐量不错，但最终可能由于工作量较大的异常值而降低到非常低的吞吐量。查看BatchSpannerRead代码，一个DoFn负责分区的所有批处理扫描工作。尽管在理想情况下，我们应该假定生成的分区应该处理这个离群值问题，但是在实践中，重新分割那些慢工的工作是否有意义？

0 个答案:

没有答案

Javascript数组排序速度受字符串长度影响？
如何从数据库分区读取器，编写不同文件并优化线程负载
Spring Batch - 多次在Reader中调用read（）方法
spring批处理：itemprocessor没有获取读者读取的所有数据
Spring批处理：分区读取器再次调用
我可以降低批处理文件的速度吗？
复合键Spring Part
慢分区读取器影响SpannerIO批读取速度
使用插件会影响移动网站的速度
如何在Spring Batch Reader中逐块读取多个数据库

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？